Zeitüberschreitung.

Sie wurden aufgrund von Inaktivität automatisch abgemeldet.
Schließen Sie dieses Fenster und loggen Sie sich erneut ein.
Dies ist eine Sicherheitsmaßnahme, um unberechtigte Zugriffe auf Ihre Informationen vorzubeugen.

Fenster schließen

Anmelden

Navigation


HortiSem - Natural Language Processing (NLP)

16.11.2022

Ausführliche Dokumentenbeschreibung

HortiSem steht als Akronym für "Horticulture and Semantik". HortiSem ist ein Verbundprojekt aus 5 Instituten. Es ist gefördert vom Bundesministerium für Landwirtschaft und Ernährung (BMEL) in der Ausschreibung "Gartenbau 4.0" (Automatisierung und Digitalisierung im Gartenbau) im Rahmen der Innovationsförderung. In diesem Video präsentieren Jascha Jung und Xia He die Projekt-Entwicklungen für den Prozess des Natural Language Processing (NLP).

Zur Anwendung kommen verschiedene Verfahren aus dem Bereich des Natural Language Processing (NLP):
Bei der Tokenisierung werden Texte in einzelne Token aufgebrochen. Ein Token kann dabei ein einzelnes Wort oder Satzzeichen sein. Grammatische Formen werden dabei zunächst beibehalten. Bei der Lemmatisierung werden Worte auf ihr Grundform, das Lemma, zurückgeführt. So wird beispielsweise dem Token "des" das Lemma "der" zugeordnet.
Wordvektoren stellen Begriffe numerisch anhand von n-dimensionalen Vektoren/Tensoren dar. Dabei sind 300 oder mehr Parameter pro Begriff nicht unüblich. Sie ermöglichen es die (grammatikalische/semantische) Ähnlichkeit von Wörtern, durch die Distanz der Vektoren zueinander, mathematisch zu berechnen. Die Erstellung von Wortvektoren mit Machine-Learning Verfahren benötigt allerdings eine sehr große Menge an Texten und eine größere Rechenleistung.
Bei der Named Entity Recognition (NER) werden Begriffe automatisch klassifiziert. Das heißt, ein Sprachmodell wird darauf trainieren, bestimmte Wörter und Begriffe in zuvor festgelegte Klassen einzuteilen. Grundlage dafür sind vor-annotierte Texte mit Beispielen der gewünschten Begriffe und Klassen in regulären Sätzen.
Die Suchmaschine findet für Stichwörter oder Texte andere relevante Texte aus dem Pflanzenschutz. 
Das letzte Modul demonstriert das Auslesen von Text aus Bilddateien.
Länge: 4:43 min

2021

DLR Rheinpfalz
Gartenbau

Isabelle Lampe ; Jascha Daniló Jung (KTBL) und Xia He (JKI)

HortiCo 4.0

Video
FuE-Projekte
Gartenbau 4.0

Deine Merklisten

Liste anlegen