Ich habe Snapshots von mehreren Webseiten bei 2 mal aufgenommen. Was ist eine zuverlässige Methode, um festzustellen, welche Webseiten geändert wurden?wie zu bestimmen, ob Webseite geändert wurde
Ich kann nicht auf etwas wie einen RSS-Feed verlassen, und ich muss geringfügige Geräusche wie Datum Text ignorieren.
Idealerweise suche ich nach einer Python-Lösung, aber ein intuitiver Algorithmus wäre auch großartig.
Danke!
Meinst du Bilder, wenn du Schnappschüsse sagst? Oder historisches HTML? –
nur der HTML - keine unterstützenden Dateien – hoju
Möchten Sie die Struktur (HTML-Tags) oder den Inhalt oder beide zu differieren? – elhoim