0

Ich arbeite an einem Projekt, in dem ich etwa 18 Klassen mit etwa 4.000 Gesamtinstanzen habe. Ich habe 7 Attribute, 1 ist String-Daten, der Rest nominal. Momentan verwende ich StringToWordVector für das string-Attribut mit dem SMO-Klassifikator von Platt und erziele gute Ergebnisse. Wir sind dabei, dies zu implementieren, aber ich würde gerne andere Klassifikatoren ausprobieren, falls ich vielleicht bessere Ergebnisse erzielen könnte. Irgendwelche Vorschläge?Weka-Klassifikationsprojekt mit StringToWordVector und SMO

Sollte ich auch MultiClassClassifier mit so vielen Klassen verwenden? Wenn ja, welche Einstellungen sollte ich versuchen?

Jeder Rat wird geschätzt!

+0

Versuchen multinomial Bayes-Klassifikator. Es ist bevorzugte Textklassifikation für Es gibt Ergebnisse auf Augenhöhe mit SVM. Es wird auch schneller sein. –

+0

Multinomial Naive Bayes ist nicht kompatibel mit mehrwertigen nominalen Attributen ist der Fehler, den ich erhalte, wenn ich versuche, das Modell auszuführen. Naive Bayes haben eine um 20% geringere Genauigkeit als SMO. Ich habe noch nicht alle Möglichkeiten mit MuliClassClassifier und Naive Bayes ausprobiert, aber ich sehe es nicht viel besser. Danke für die Empfehlung! –

Antwort

0

Ein AdaBoosted J48 Decision Tree ergab die besten Ergebnisse wurden in unserer Abteilung gut etabliert