Neben der PCA oder der Darstellung der Daten, indem sie auf die beiden PCs projiziert wird und die Darstellung im 2-D-Raum erstellt wird, welche anderen Techniken können einen Hinweis auf die Datenunterscheidung geben?Was sind die Angaben oder Metriken der Datentrennung in der Klassifizierung mit Ausnahme der Datenvisualisierung?
Antwort
Wenn Sie nur zwei Klassen in Ihrer Klassifikationsaufgabe haben, können Sie verwenden:
1. ROC/AUC/GINI: sie könnten Sie in einer verständlichen Art und Weise präsentieren, ob die Punktzahl von Ihrem Klassifikator bei Trennung gut deine Klassen.
2. ANN: VISUALISIERUNG EINER LETZTEN SCHICHT: Sie können eine Art der Datenvisualisierung auf Ausgaben von einer letzten Schicht Ihres Netzwerks verwenden. Wenn Klassen dort gut getrennt sind, können Sie eine gute Unterscheidung zwischen ihnen erwarten.
Dies sind Methoden, die ich normalerweise verwende. Für Multiclass-Aufgaben bleibt die zweite Methode gleich. In der ersten konnte man Erste vs Ruhe, Second vs Erholung nutzen usw.
UPDATE: ich Ihnen dringend raten andere Methoden Visualisierung/Dimensionsreduktion zu verwenden, wie T-SNE oder ISOMAPS. Sie können eine ausführliche Erklärung dieser Methoden here lesen.