Ich klassifiziere Dokumente basierend auf ihrer Tasche der Wörter Darstellung (Features: 1000). Für die Klassifizierung verwende ich eine SVM, es scheint, dass die SVM manchmal nicht endet und endlos läuft. (Laufendes sci-kit: SVC (C = 1.0, kernel = 'linear', cache_size = 5000, verbose = True)) Jetzt suche ich nach einer Lösung, ich habe darüber nachgedacht, einen MinMax-Scaler anzuwenden, um eine Berechnung zu erhalten effiziente Dokumentendarstellung. Aber vermassele ich meine Tasche der Wortdarstellung mit der Feature-Normalisierung?Text-Klassifizierung: Beutel mit Wörtern mit MinMax-Scaler
Vielen Dank im Voraus!