Ich versuche, einzigartige Kombinationen von Telefonnummern und Werte zu erhalten, wo Telefonnummern und Werte sind jeweils in zwei möglichen Spalten.Python Pandas - einzigartige Kombinationen von Variablen in mehreren spezifischen Spalten
Zum Beispiel:
df = pd.DataFrame({'phone1':[4567890876, 4567890876, 9178889999, 3237800876],
'phone2':[4567890876, 4567890876, 9178889999, 2139990000],
'num1':[1,2,3,3],
'num2':[5,2,3,1]})
Die einzigartigen Werte würde wie folgt aussehen:
phone num
4567890876 1
4567890876 2
4567890876 5
9178889999 3
2139990000 1
2139990000 3
3237800876 1
3237800876 3
ich zwei Wege gefunden, dies zu tun, aber sie beide fühlen sich sehr ungeschickt/falsch:
1) Kopieren des df viermal (phone1/num1, phone1/num2, phone2/num1, phone2/num2), Verketten und Löschen von Duplikaten
Indexing2) durch die Telefonfelder, Stapel, dann die Indizierung durch die Zahlenfelder und Stapel wieder und Abwurf dupliziert
Wenn jemand besser/Reiniger/schnelle Ideen, wäre es sehr zu schätzen!
Warum erscheinen '2139990000' und' 3237800876' zweimal im resultierenden DF? – MaxU