2016-05-09 6 views
0

I Tranning Satz bestehend aus 36 Merkmalen aufweisen. als ich den "erklärten" Wert von PCA mit Matlab berechnete. Ich merke, dass nur die ersten 24 Komponenten wichtig sind.Ist SVM elastischen Rausch

meine Frage ist, würde ich gewinnen eine bessere Genauigkeit (Vorhersage), wenn ich die Reset der Komponenten (die anderen 12 Komponenten) auslassen. Oder SVM ist sehr robust gegen Rauschen, was bedeutet, dass unabhängig davon, ob ich die anderen 12 Komponenten entfernt oder nicht. Leistung wird sich nicht viel ändern.

Antwort

1

Es gibt keine allgemeingültige Antwort, ist es unmöglich, immer zu sagen „was Methode X passieren wird, wenn ich mit Y vorverarbeiten“. Im Allgemeinen jedoch:

  • Vorverarbeitung Heuristik ist eine schlechte Idee (PCA ist nur eine heuristische, gibt es keine Rechtfertigung aus überwachten Lernens ist, es zu benutzen) - über sie denken, wenn „reine“ Methode fehlschlägt, nicht bevor es
  • die Tatsache, fais dass PCA Dimensionen als weniger wichtig identifiziert bedeutet nicht, dieser Lärm sind
  • SVM Fähigkeit, mit Lärm zu tun verwendet auf der Rauschstärke und Kernel abhängt, für High-Bias-Kerne wie linearen oder polynomisches Rauschen sollte nicht das Problem sein, für Low-Bias wie RBF - es wird die Klasse beeinflussen ifizierung, aber wieder - echter Lärm unterstützt Ihr rescription nicht Definition von wirklichem Rauschen passen.