2009-07-07 8 views
2

Ich arbeite mit einem Kunden, um eine Website von der vorhandenen Produktionshardware in eine neue Hardwareumgebung zu migrieren. Jetzt scheint es eine ausgezeichnete Zeit zu sein, ein Audit durchzuführen und alte oder überholte Inhalte zu entfernen, statt sie einfach blind wieder zu kopieren.Tools für die Bereinigung von Website-Inhalten?

Gibt es irgendwelche guten kostenlosen Tools oder Skripts, die ich verwenden kann, um den Web-zugänglichen Inhalt auf einem Server mit den tatsächlichen Dateien auf einem Server zu vergleichen, um zu sehen, welcher Inhalt tatsächlich verknüpft und verwendet wird?

Vielen Dank im Voraus für jede Hilfe!

Antwort

0

Ich bin mir sicher, dass es da ist, aber ich bin mir sicher, dass es keinen gibt, der einen besseren Job machen könnte als du selbst, weißt du? Wie groß ist diese Seite und hast du sie selbst programmiert?

+0

Die Website ist sehr groß, irgendwo im Bereich von 2-3000 Seiten, plus die referenzierten Bilder und Dateien. Es ist nicht praktisch, es von Hand zu machen. Ich könnte ein Skript schreiben, um jede Seite zu analysieren, die Links zu extrahieren und sie bis zur Fertigstellung zu überprüfen, jede gefundene Seite aufzuzeichnen. Vergleichen Sie dann mit dem Dateisystem, aber das würde viel Zeit in Anspruch nehmen. Ich bin nicht die erste Person, die dies tun muss, also denke ich, dass es ein kostenloses oder Open-Source-Tool geben muss, das helfen könnte, ich weiß nur nicht von einem. –

2

Nun, für Anfänger können Sie ein Tool wie Xenu's Link Sleuth verwenden, um alle Ihre Seiten spinnen, um gebrochene Links und dergleichen zu finden. Wir haben dieses Tool in unserem Intranet verwendet, um unsere fehlerhaften Links zu finden und zu reparieren. Es ist kostenlos und erledigt die Arbeit.

Ein anderes Tool, das wir für Migrationen zwischen Systemen verwendet haben, ist eine Suchmaschine. Eine gute Suchmaschine spinnt alle Ihre Seiten und zeigt die Zwei-Wege-Beziehung zwischen den Links. Auf diese Weise können Sie herausfinden, welcher Inhalt am häufigsten verknüpft ist und was möglicherweise verwaist ist. Leider sind diese Arten der Werkzeuge nicht frei.