Ich habe ein Krebs-Datensatz mit 699 Zeilen und 11 Attributen (einschließlich Klassenattribut). Wie kann ich den Datensatz in Trainings- und Testdatensätze aufteilen? Ich kenne folgende Dinge. Sind sie wahr? (1) Auswahl Initial 150 Zeilen für die Prüfung und die verbleibenden 549 für die Ausbildung (2) Auswahl Initial 549 für die Ausbildung und die verbleibenden 150 zum TestenWie generiere ich Trainings- und Testdatensätze aus einem gegebenen Standarddatensatz von UCI
Weiterhin muss ich die Klasse gehören in beiden Datensätzen Attribute? Ist es auch notwendig, einen anderen Datensatz namens "VALIDATION DATASET" zu haben? Ich mache Klassifizierung mit SVM