Ich bin auf der Suche nach einem pdf von einer URL mit vb.net Code herunterladen. Die URL gibt eine Seite mit einem eingebetteten PDF-Plugin zurück. Ich möchte Code, der das PDF automatisch herunterladen und speichern würde. Hier ist ein Beispiel url http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=PK&language=en&productNumber=S9888&brand=SIALDownload pdf von URL, die ein eingebettetes Plugin
Antwort
Laden Sie die HTML-Quelle der URL Quelle WebClient wie diese
Dim myWebClient As New WebClient()
myWebClient.DownloadFile("http://example.com/somepage.html", "downloadedpage.html")
mit Dann regular expression gegen diesen
downloadedpage.html
wie folgt ausführen:iframe.+src\=\"(.+)\"
: es gibt die erste Übereinstimmung als Quelle der PDF-Datei zurück. Sie können durch Zugabe vonhttp://example.com
plus der Unter url Sie extrahiert haben, auf Schritt2
- schließlich, laden Sie die endgültige PDF-Datei aus dem Link, den Sie mit regulären Ausdrücken online unter Regexp Hero
- bilden das letzte Glied in PDF-Datei spielen haben zusammengesetzt auf Schritt
3
Danke für Ihre Antwort. Ich habe Ihren Vorschlag bis Schritt 3 gefolgt und die Sub-URL erhalten, aber wenn ich versuche, es mit WebClient.DownloadFile (URL, Dateiname) zu downloaden, bekomme ich eine "Es tut mir leid, Datei nicht gefunden" -Seite anstelle der Datei. Das Laden der Sub-URL im Browser erzeugt auch dieselbe Seite. – Sami
@sami scheint, als ob der Quellserver nach der Verweis-URL oder dem Header sucht, der vom selben Server stammen sollte –
Ihre Frage scheint Leute zu bitten, Code für Sie zu schreiben; Dafür ist StackOverfloew nicht da. Bitte besuchen Sie http://stackoverflow.com/help/how-to-ask und bearbeiten Sie dann Ihre Frage entsprechend. Sie werden bessere Ergebnisse erzielen. – DWRoelands