-1

Ich arbeite derzeit an einer Multi-Label-Klassifizierung. Als Klassifizierer verwende ich SVMlight und binarisiert das Multi-Label-Problem. Das bedeutet in meinem Fall mehr als 1000 Klassifizierungsläufe.Leistung SVMlight Multilabel Classification (Features: 1000)

Ich habe eine feste Feature-Größe von 1000, dauert das Training der Modelle jetzt mehr als 3 Tage (2 GHz Intel Core 2 Duo, 8 GB). Hat jemand Erfahrung, wenn es üblich ist, dass es so lange dauert oder können Sie mir einen Rat geben, wie Sie die Leistung steigern können? Glauben Sie, dass ein Wechsel zu einer Hochleistungsmaschine große Wirkung hätte?

Vielen Dank im Voraus!

+0

und was ist die genaue Einrichtung von SVMs? Welche Hyperparameter werden getestet? Wie groß ist das Trainingsset? – lejlot

+0

Ich verwende SVM im Klassifizierungsmodus mit einem linearen Kernel und SVMlight-Standardwerten für die anderen Parameter. Das Trainingset besteht aus 20 000 Dokumenten – jobooo

Antwort

0

Feature-Normalisierung löste mein Problem, die Leistung war viel schneller nach min/max ([-1,1]) Normalisierung im Feature-Raum.