Wie stelle ich einen Satz/eine Liste von Elementen in den Eingabedaten (Datenrahmen) für H2O dar?Repräsentieren Sie eine Liste von Elementen in der Eingabe-CSV für H2O
Ich benutze Mineralwasser 1.6.5 mit H2O Flow. Meine Eingangsdaten (Spalten in der CSV-Datei) wie folgt aussehen:
age: numeric
gender: enum
hobbies: ?
sports: ?
Hobbys und Sport sind Listen/Sätze mit einer begrenzten Anzahl von möglichen Einträgen (~ 20 jeweils). H2O scheint dafür keinen geeigneten Datentyp zu haben. Wie kann ich diese in eine CSV-Datei exportieren, die von H2O Flow verarbeitet werden kann?
Keine Ahnung von h2o, aber maschinelles Lernen hat ein Konzept namens 'one hot encoding'. Sie können einfach jeden möglichen Eintrag in Ihrem Hobby und Sport machen eine "CSV-Spalte" selbst, die binär wie Ihr Geschlecht Attribut ist. –
Klingt wie eine gültige Option, danke. Ich hoffe jedoch, dass es einen einfacheren/wartungsfreundlicheren Weg gibt, als dies manuell zu tun. –