Ich arbeite mit einem Kunden, um eine Website von der vorhandenen Produktionshardware in eine neue Hardwareumgebung zu migrieren. Jetzt scheint es eine ausgezeichnete Zeit zu sein, ein Audit durchzuführen und alte oder überholte Inhalte zu entfernen, statt sie einfach blind wieder zu kopieren.Tools für die Bereinigung von Website-Inhalten?
Gibt es irgendwelche guten kostenlosen Tools oder Skripts, die ich verwenden kann, um den Web-zugänglichen Inhalt auf einem Server mit den tatsächlichen Dateien auf einem Server zu vergleichen, um zu sehen, welcher Inhalt tatsächlich verknüpft und verwendet wird?
Vielen Dank im Voraus für jede Hilfe!
Die Website ist sehr groß, irgendwo im Bereich von 2-3000 Seiten, plus die referenzierten Bilder und Dateien. Es ist nicht praktisch, es von Hand zu machen. Ich könnte ein Skript schreiben, um jede Seite zu analysieren, die Links zu extrahieren und sie bis zur Fertigstellung zu überprüfen, jede gefundene Seite aufzuzeichnen. Vergleichen Sie dann mit dem Dateisystem, aber das würde viel Zeit in Anspruch nehmen. Ich bin nicht die erste Person, die dies tun muss, also denke ich, dass es ein kostenloses oder Open-Source-Tool geben muss, das helfen könnte, ich weiß nur nicht von einem. –