2016-07-23 8 views
0

Ich habe einen DataFrame mit einer ID-Variablen und einer anderen kategorialen Variablen. Ich möchte mit get_dummies Dummy-Variablen aus der kategorialen Variable erstellen.Behalte andere Variablen bei der Ausführung von get_dummies in Pandas

dum = pd.get_dummies(df) 

Dies führt jedoch dazu, dass die ID-Variable verschwindet. Und ich brauche diese ID-Variable später, um mit anderen Datensätzen zu verschmelzen.

Gibt es eine Möglichkeit, andere Variablen zu behalten. In der Dokumentation von get_dummies konnte ich nichts finden. Vielen Dank!

+0

Können Sie ein Beispiel für Ihre 'df' zur Frage hinzufügen? Mein erster Versuch wäre es, 'ID' beim Aufruf von' get_dummies' auszuschließen und später die Spalte erneut hinzuzufügen. – mhoff

Antwort

0

Ich fand die Antwort. Sie können den Dummy-Datensatz wie unten gezeigt mit dem ursprünglichen Datensatz verketten. Solange Sie die Daten in der Zwischenzeit nicht neu bestellen.

df = pd.concat([df, dum], axis=1)