Ich habe ein Skript, das Verkaufswerte in separate Zeilen in einer Datei schreibt und das ultimative Ziel ist, die Daten in einer Datenbank zu speichern. Das Problem, auf das ich stoße, ist, dass es doppelte Einträge für denselben Verkäufer, Datum, Produkt, Preis und Menge gibt.Duplikate finden, zur Variablen hinzufügen und entfernen
Mein Code ist wie folgt in die Datei geschrieben:
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
John 07-15-2016 Tool Belt $100 2
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
Wie entferne ich die Duplikate und sie zusammen fügen? das heißt, die ausgegeben zu werden:
John 07-15-2016 Tool Belt $100 6
Sara 07-15-2016 Hammer $100 6
I Zähler verwendet habe, aber es mehrere Instanzen nicht fangen, noch kann ich einen Weg finden, die beiden zusammen zu fügen.
Jede Hilfe wäre willkommen.
Script:
for line in s:
var = re.compile(r'(\$)',re.M)
line = re.sub(var, "", line)
var = re.compile(r'(\,)',re.M)
line = re.sub(var, "", line)
line = line.rstrip('\n')
line = line.split("|")
if line[0] != '':
salesperson = str(salesperson)
date = dt.now()
t = line[0].split()
print t
t = str(t[0])
try:
s = dt.strptime(t, "%H:%M:%S")
except:
s = dt.strptime(t, "%H:%M")
s = s.time()
date = dt.combine(date, s)
date = str(date)
price = line[1]
quantity = line[2]
fn.write("%s %s %s %s \n" % (salesperson, date, price, quantity))
fn.close()
Wie schreiben Sie die Datei? zeige den relevanten Teil deines Skripts – Gocht
@Gocht Ich habe es bearbeitet, um das Skript anzuzeigen – Dorian
Sie könnten ein Wörterbuch erstellen, um die Werte zu verfolgen, während Sie die Datei lesen, und erst schreiben, wenn Sie mit der Verarbeitung Ihrer Daten fertig sind. Das Schreiben auf dem Weg erlaubt es Ihnen nicht effektiv zurück zu verfolgen. – Hobbes