Dies ist nicht so sehr ein spezifisches Problem als etwas, das ich eher für eine "Pythonic" philosophische Antwort suche. Nämlich, was ist der beste Weg, um einzigartige Dinge zu verfolgen und sicherzustellen, dass keine Duplikate entstehen?Was ist der effizienteste Weg, um die heruntergeladenen Dateien in einem Python-Programm nachzuverfolgen?
Zum Beispiel schreibe ich ein Skript, um eine Website für Links zu Songs auf SoundCloud zu kratzen, damit ich sie automatisch herunterladen kann. Wenn ich dieses Programm beispielsweise mit cron
automatisieren möchte, was ist der effizienteste Weg, um sicherzustellen, dass ich nur Inhalte herunterlade, die ich noch nicht habe?
Oder, wenn ich Bilder heruntergeladen habe, wie kann ich sicherstellen, dass es keine Duplikate gibt, oder habe ich einen Prozess, der Duplikate effizient sucht und entfernt?
Art der offenen Enden, so wenig oder so viel wie Sie bitte beitragen.
Danke.