NLP: Stellen Sie fest, ob eine bestimmte semantische Bedeutung in einem Satz gefördert wird

Ich habe eine Sammlung von Sätzen, von denen ich gerne würde diejenigen extrahieren, die die folgende semantische Bedeutung haben:NLP: Stellen Sie fest, ob eine bestimmte semantische Bedeutung in einem Satz gefördert wird

I italienische Küche mögen.

Es gibt viele Variationen, wie ein solcher Satz strukturiert und formuliert werden kann. Einige Beispiele:

Ich genieße Italienisch, Chinesisch und Indisches Essen.
Küchen Ich liebe sind Chinesen, Italiener und Inder.
Einige Küchen, die ich mag, umfassen indische, italienische und chinesische.
Ich mag alle Arten von Küchen auf der ganzen Welt, wie Italienisch, Chinesisch und Indisch.

Was ist ein guter Weg, dieses Problem anzugehen?

Ich bin kein Experte in NLP. Hier ist nur etwas, was ich denken konnte:

Suche Synonyme für ‚wie‘ und ‚Küche‘
Build-Abhängigkeit Bäume für Sätze mit einem Parser (Stanford oder Parsey McParseface)
Schneiden Sie den Abhängigkeitsbaum zu nur das Subjekt (z. B. "I"), das Verb-Keyword (z. B. "wie"), das Substantiv-Keyword (z. B. "Essen") und den Substantiv-Modifikator (z. B. "Italienisch"). Dies kann getan werden, indem ein Pfad gefunden wird, der alle diese Knoten in dem Baum abdeckt.
Speichern Sie eine Sammlung von Abhängigkeitsstrukturen von Trainingssätzen.
Überprüfen Sie, ob die Abhängigkeitsstruktur eines Test Satz besteht in der Ausbildung

Alle Ideen, Vorschläge und/oder Kommentare sehr geschätzt werden würde!

Quelle

2016-05-31 user3850761

Dies ist eine relation extraction Aufgabe, und wie alle nlp Aufgaben ist es nicht einfach. Stanford CoreNLP verfügt über ein Relationsextraktionsmodul. Sehen Sie, ob Sie es verwenden oder Ihre Daten trainieren können. –

Ich denke, Sie sind auf dem richtigen Weg. Meine Idee benötigt die Synonyme, die Sie identifiziert haben (zum Beispiel "Genießen" = "Gefällt mir" = "Liebe", "Essen" = "Küche") an erster Stelle. Wenn Sie in Ihrem Korpus anschaut, kann man alle Sätze haben einige identische Muster finden, dh

--- I --- genießen/wie/Liebe --- Italienisch ---

"-" bedeutet alle anderen Tokens in den Sätzen. Sie können einen Muster-Mining-Algorithmus (z. B. PrefixSpan) verwenden, um zuerst dieses Muster zu erkennen. Wenn Sie diesen Schritt getan haben, sind Sie der Antwort ziemlich nahe. In Bezug darauf, wie man das Wort "Küche" am Ende des Musters hinzufügt, müssen Sie wahrscheinlich Stanford Dependency Parser verwenden, um die Abhängigkeiten zu erhalten und das Paar bestehend aus Wörtern "Italienisch" und "Küche" zu extrahieren. Endlich können Sie diese beiden Ergebnisse kombinieren und erhalten Ihre Antwort. Um einen Satz zu testen, betrachten Sie ihn einfach, wenn er das Muster hat.

Dieser Ansatz hat Einschränkungen, wenn ein solches Muster nicht existiert oder die Syntax der Sätze zu kompliziert ist, um ein Muster zu finden. Und es ist auch nicht auf der semantischen Ebene. Daher bin ich sehr an der Antwort anderer interessiert, wie diese Situation gelöst werden kann. Ich werde updaten, wenn ich ein paar Ideen bekomme, wie man es auf einer realen semantischen Ebene lösen kann.

Ich hoffe, es hilft.

Quelle

2016-12-30 05:29:09 user7344209

NLP: Stellen Sie fest, ob eine bestimmte semantische Bedeutung in einem Satz gefördert wird

Antwort

Verwandte Themen