Ich habe an einem Projekt gearbeitet, das mich fragt, Schlüsselwort-/Schlüsselsatzvorschlag basierend auf Beschreibung des Produktes zu geben.Schlüsselwortvorschlag Algorithmus
Was ich gerade habe: Beschreibung des Produkts, Produktkategorie (Mai oder nicht vorhanden).
Was ich will: Maschinengenerierte Schlüsselwörter/Schlüsselphrasen basierend auf Beschreibung.
Welche Untersuchungen habe ich durchgeführt: (NLP-basierter Ansatz) Dieses Problem kann in zwei getrennte Ansätze unterteilt werden.
- Nicht die Vergangenheit Daten mit: Just einer Zusammenfassung der aktuellen Beschreibung
- Methode: - Tokenisierung, ergeben, Stoppwörter Entfernung usw. (Preprocessing)
- Shallow NLP (Constituency Parsing) und behalten nur & NP JJ Sätze .
Dies wäre ein Ansatz, der keine in der Datenbank vorhandene Beschreibung verwendet.
Was ich suchte, ist ein besserer Ansatz, der ML-Algorithmen verwendet und auch meine früheren Produktbeschreibungsdaten verwendet.
Ich habe darüber nachgedacht, flaches Parsing auf den gesamten Datensatz anzuwenden und dann Schlüsselwörter zu geben, die in mehr als N Produkten zusammentreffen.
Welcher Algorithmus oder Ansatz würde sich als nützlich erweisen? Wie kann ich meine Daten verwenden?
Haben Sie eine große Auswahl an Produkten mit bereits vorhandenen Schlüsselwörtern, die Sie zum Lernen verwenden können? –
Ja, ich habe Keywords in Bezug auf "einige" der Produktbeschreibungen. –