2016-07-10 6 views
0

Ich verwende WEKA zur Klassifizierung. Ich verwende die WEKA-JAR-Datei in meinem Java-Code. Mein Trainingsdatensatz hat 56000 Instanzen und 1253 Funktionen. Ich benutze einfache Klassifikationsalgorithmen wie logistische Regression, J48, Random Forest Random Tree usw. Ich kann nur Ergebnisse für Random Forest erhalten. Während des Trainingsmodells für andere Klassifikatoren lief mein Programm 6-7 Stunden lang, aber ich bekam kein Ergebnis oder Fehler.WEKA auf großem Trainingsdatensatz (Java-Code)

Kann jemand bitte einen schnelleren Weg vorschlagen, die WEKA-Klassifizierer auf großen Datenmengen zu trainieren.

Danke!

Antwort

3

Da wekas Implementierung von maschinellen Lernalgorithmen den gesamten Datensatz im Hauptspeicher lädt, kann es sehr zeitaufwändig sein, Modelle zu trainieren. Die Verwendung von Weka via Kommandozeile kann dabei helfen. Es gibt auch andere Wege, wie die Trainingszeit verkürzt werden kann. Sie sind unter http://www.cs.waikato.ac.nz/ml/weka/bigdata.html

eingetragen Hoffe, es hat geholfen.