Rohdaten:Support Vector Machines - Vorhersage der Popularität von Artikeln - Was mache ich falsch?
Artikel Inhalt und Titel. 10000 Artikel
Features: (ich sie aus den Daten extrahiert)
Anzahl der Wörter des Titels
Anzahl der Wörter des Artikels
Anzahl der Facebook-Likes
Erscheinungszeitraum: Wochenende oder nicht
Zunächst möchte ich sagen, dass ich ML sehr neu bin.
Ich versuche, die Daten zu verwenden, um ein Modell mit SVM zu erstellen. Dieses Modell wird vorhersagen, ob ein Artikel wahrscheinlich beliebt ist oder nicht. Ich nahm an, ein Artikel ist beliebt, wenn seine Anzahl von FB Likes größer als 2000 ist.
Ich erstellte eine 5D-Karte (4 Dimension für die 4 Funktionen und 1 für die binäre Popularität Informationen) mit den Trainingsdaten. Jeder Artikel und seine Features haben einen Punkt im 5D-Raum.
Ich versuche, diese 5D-Karte mit SVM zu verwenden, damit es einen optimalen Rand erstellt.
Dann werde ich diesen Rand verwenden, um Popularität mit Testdaten vorherzusagen.
Wenn es um die Implementierung geht, bin ich sehr fest.
Mache ich etwas falsch? Wie sollte ich SVM mit diesem Problem verwenden?
Jede Hilfe wird geschätzt. Vielen Dank!
Welche Sprache/Software und Kernel verwenden Sie zur Implementierung der SVM? – ode2k
@ ode2k hofft, lineares Polynom und Gaussian als Kernel zu verwenden. Sprache ist Matlab im Moment – user4751640