Ich mache einige NLP-Aufgaben. Ein Feature in meiner Liste ist das POS-Tag eines Satzes. Wie kann ich die POS-Tags als Feature an SVM übergeben, da numerische Daten erwartet werden?Wie kategorische Variablen zu SVM übergeben werden
Antwort
Sie können Map/Dictionary erstellen, um jedes POS-Tag in Nummer zu konvertieren.
Listen Sie alle POS-Tags auf und weisen Sie ihr eine bestimmte Nummer zu. Zum Beispiel
NN -> 1
JJ -> 2
VB -> 3
DT -> 4
...
...
Jedes Mal, wenn Sie einen bestimmten PO begegnen, sie an ihre entsprechenden Nummer ändern.
Eine Basis dafür? –
Es ist einer der Standardprozess, der von vielen Forschern verfolgt wird. Sie können mehrere Papiere finden, wo die Umwandlung auf diese Weise erfolgt. – RAVI
Denken Sie naiv, was ist POS? Es stellt einige Informationen über Token bereit. NN, JJ, .. ist nur eine Darstellung. Anstelle von NN, JJ, VB, DT, ... verwenden wir 1, 2, 3, 4, ... als Repräsentation. – RAVI
An welcher NLP-Aufgabe arbeiten Sie? – RAVI