Ich arbeite an einem Projekt, in dem ich etwa 18 Klassen mit etwa 4.000 Gesamtinstanzen habe. Ich habe 7 Attribute, 1 ist String-Daten, der Rest nominal. Momentan verwende ich StringToWordVector für das string-Attribut mit dem SMO-Klassifikator von Platt und erziele gute Ergebnisse. Wir sind dabei, dies zu implementieren, aber ich würde gerne andere Klassifikatoren ausprobieren, falls ich vielleicht bessere Ergebnisse erzielen könnte. Irgendwelche Vorschläge?Weka-Klassifikationsprojekt mit StringToWordVector und SMO
Sollte ich auch MultiClassClassifier mit so vielen Klassen verwenden? Wenn ja, welche Einstellungen sollte ich versuchen?
Jeder Rat wird geschätzt!
Versuchen multinomial Bayes-Klassifikator. Es ist bevorzugte Textklassifikation für Es gibt Ergebnisse auf Augenhöhe mit SVM. Es wird auch schneller sein. –
Multinomial Naive Bayes ist nicht kompatibel mit mehrwertigen nominalen Attributen ist der Fehler, den ich erhalte, wenn ich versuche, das Modell auszuführen. Naive Bayes haben eine um 20% geringere Genauigkeit als SMO. Ich habe noch nicht alle Möglichkeiten mit MuliClassClassifier und Naive Bayes ausprobiert, aber ich sehe es nicht viel besser. Danke für die Empfehlung! –