Ich habe die folgenden zwei Datenrahmen in Pandas:Wie ein Datenrahmen in Pandas Python aktualisieren
DF1:
AuthorID1 AuthorID2 Co-Authored
A1 A2 0
A1 A3 0
A1 A4 0
A2 A3 0
DF2:
AuthorID1 AuthorID2 Co-Authored
A1 A2 5
A2 A3 6
A6 A7 9
Ich möchte (ohne Looping und zu vergleichen), um die passenden AuthorID1 und AuthorID2 Paarung in DF2 zu finden, die in DF1 existieren und aktualisiere die Spaltenwerte entsprechend. Also wäre das Ergebnis für die obigen zwei Tabellen das folgende:
Resulting Updated DF1:
AuthorID1 AuthorID2 Co-Authored
A1 A2 5
A1 A3 0
A1 A4 0
A2 A3 6
Gibt es einen schnellen Weg, dies zu tun? Da ich 7 Millionen Zeilen in DF1 habe und Schleifen und Vergleiche nur ewig dauern würden.
Update: beachten Sie, dass die letzten beiden in DF2 nicht Teil des Updates in DF1 sein sollte, da es nicht in DF1
würde dies immer noch funktionieren, wenn ich mehr Spalten in DF1 habe, aber nur die Spalte "Co-Authored" in DF1 auf der Grundlage der aktualisierten Werte in DF2 aktualisieren möchte? – BKS
Für mich funktioniert es mit dem Hinzufügen neuer Spalte zu 'DF1', gib mir eine Zeit, ich füge Probe hinzu. – jezrael
Ich habe ein anderes Problem. Was ist, wenn DF2 Werte für AuthorID1 und AuthorID2 enthält, die nicht in DF1 enthalten sind? In diesem Fall sollte es ignoriert werden und nicht auf DF1 aktualisiert werden. Wie lege ich die Kriterien für die Aktualisierung fest? Ich werde die Frage entsprechend bearbeiten, es scheint "Update" funktioniert in diesem Fall nicht – BKS