Ich versuche, alle Links einer sitemap.xml zu crawlen, um eine Website neu zu cachen. Aber die rekursive Option von wget funktioniert nicht, ich bekomme nur als Antwort:Crawl Links von sitemap.xml über wget Befehl
Remote-Datei existiert, enthält aber keine Verbindung - nicht abrufen.
Aber sicher ist die sitemap.xml voll von "http: // ..." Links.
versuchte ich fast jede Möglichkeit, wget, aber nichts für mich gearbeitet:
wget -r --mirror http://mysite.com/sitemap.xml
Hat jemand weiß, wie alle Links zu öffnen innerhalb einer Website sitemap.xml?
Danke, Dominic
Wie kann ich jeden heruntergeladenen HTML-Dateinamen auf den Titel der Seite einstellen? Im Moment ist alles nur index.html, index.html.1, index.html.2 etc. – user2028856
würde gerne eine Ausarbeitung zu diesem Thema, dass viele Kinder in der XML-Dateistruktur ... jemand? Das ist aber nett! Vielen Dank! – lcm
Ich habe die Sitemap im GZ-Format, wie sollte ich URLs davon besuchen. – StarWars