Ich versuche, SVMLight zu verwenden, um einen Klassifikator zu erstellen, um zu erkennen, ob eine Noun Phrase (NP) anaphorisch ist oder nicht. Ich habe meine Funktionen, aber ich bin fest daran, das Format der Eingabedatei zu verstehen, sollte ich all meinen Text in dieses Format übersetzen oder ich gebe nur den NP ein, der eine positive Instanz und eine negative Instanz darstellt. Und gibt es eine Software, mit der ich meine Datei in dieses Format übersetzen kann?SVMLight: Wie kann ich einen Klassifikator erstellen?
<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float> //for positive instance should I put +1
<feature> .=. <integer> | "qid" //should I do this line for all my feature
<value> .=. <float>
<info> .=. <string> //Should this contain the NP
Auch für die Modelldatei, was sollte diese Datei genau enthalten?
Ihre Hilfe würde sehr geschätzt werden.
auch verweisen: [link] http://stackoverflow.com/a/37589726 – Nandadeep