Ich habe eine Sammlung von Sätzen, von denen ich gerne würde diejenigen extrahieren, die die folgende semantische Bedeutung haben:NLP: Stellen Sie fest, ob eine bestimmte semantische Bedeutung in einem Satz gefördert wird
I italienische Küche mögen.
Es gibt viele Variationen, wie ein solcher Satz strukturiert und formuliert werden kann. Einige Beispiele:
- Ich genieße Italienisch, Chinesisch und Indisches Essen.
- Küchen Ich liebe sind Chinesen, Italiener und Inder.
- Einige Küchen, die ich mag, umfassen indische, italienische und chinesische.
- Ich mag alle Arten von Küchen auf der ganzen Welt, wie Italienisch, Chinesisch und Indisch.
Was ist ein guter Weg, dieses Problem anzugehen?
Ich bin kein Experte in NLP. Hier ist nur etwas, was ich denken konnte:
- Suche Synonyme für ‚wie‘ und ‚Küche‘
- Build-Abhängigkeit Bäume für Sätze mit einem Parser (Stanford oder Parsey McParseface)
- Schneiden Sie den Abhängigkeitsbaum zu nur das Subjekt (z. B. "I"), das Verb-Keyword (z. B. "wie"), das Substantiv-Keyword (z. B. "Essen") und den Substantiv-Modifikator (z. B. "Italienisch"). Dies kann getan werden, indem ein Pfad gefunden wird, der alle diese Knoten in dem Baum abdeckt.
- Speichern Sie eine Sammlung von Abhängigkeitsstrukturen von Trainingssätzen.
- Überprüfen Sie, ob die Abhängigkeitsstruktur eines Test Satz besteht in der Ausbildung
Alle Ideen, Vorschläge und/oder Kommentare sehr geschätzt werden würde!
Dies ist eine relation extraction Aufgabe, und wie alle nlp Aufgaben ist es nicht einfach. Stanford CoreNLP verfügt über ein Relationsextraktionsmodul. Sehen Sie, ob Sie es verwenden oder Ihre Daten trainieren können. –