2016-03-27 3 views
0

Ich habe Datenrahmen von vier SäulenVerwenden Sie zwei Spalten zur eindeutigen Identifizierung Eintrag

df2 = pd.DataFrame(columns="EmployeeName","JobTitle","TotalPayBenefits","Year"]) 

ich eindeutige Einträge in dem Datenrahmen auf den Säulen „EmployeeName“ und „Jobtitel“ Basis finden will unter Berücksichtigung gleichzeitig beide.

Ich habe versucht, die Felder verketten

df["EmployeeName"].concatenate(df2011["JobTitle"]) 

Aber es hilft nicht. Brauchen Sie Hilfe herauszufinden.

Dank

Antwort

1

Just do:

df2[~df2[["EmployeeName","JobTitle"]].duplicated()] 
+0

Oberst Dank aber mit diesem gibt es die Datenrahmen mit einer modifizierten Indexspalte aus .. Gibt es eine Möglichkeit, es .. ohne zu bekommen, dass ich tun kann, dass Indem Sie die Spalten auswählen und einen neuen Datenrahmen einfügen, aber alles, was in – madKC

+1

eingebaut ist, erhalten Sie einen Datenrahmen mit eindeutigen Paaren in der gewünschten Spalte mit Zeilen, die mit dem ursprünglichen Index markiert sind. Sie können '.reset_index (drop = True)' ketten, um den Index bei Bedarf zurückzusetzen. –

+0

Das hat funktioniert .. Vielen Dank – madKC