2016-04-07 2 views
0

Ich bin auf der Suche nach einem pdf von einer URL mit vb.net Code herunterladen. Die URL gibt eine Seite mit einem eingebetteten PDF-Plugin zurück. Ich möchte Code, der das PDF automatisch herunterladen und speichern würde. Hier ist ein Beispiel url http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=PK&language=en&productNumber=S9888&brand=SIALDownload pdf von URL, die ein eingebettetes Plugin

+0

Ihre Frage scheint Leute zu bitten, Code für Sie zu schreiben; Dafür ist StackOverfloew nicht da. Bitte besuchen Sie http://stackoverflow.com/help/how-to-ask und bearbeiten Sie dann Ihre Frage entsprechend. Sie werden bessere Ergebnisse erzielen. – DWRoelands

Antwort

0
  1. Laden Sie die HTML-Quelle der URL Quelle WebClient wie diese

    Dim myWebClient As New WebClient() myWebClient.DownloadFile("http://example.com/somepage.html", "downloadedpage.html")

  2. mit Dann regular expression gegen diesen downloadedpage.html wie folgt ausführen: iframe.+src\=\"(.+)\": es gibt die erste Übereinstimmung als Quelle der PDF-Datei zurück. Sie können durch Zugabe von http://example.com plus der Unter url Sie extrahiert haben, auf Schritt 2

  3. schließlich, laden Sie die endgültige PDF-Datei aus dem Link, den Sie mit regulären Ausdrücken online unter Regexp Hero

  4. bilden das letzte Glied in PDF-Datei spielen haben zusammengesetzt auf Schritt 3
+0

Danke für Ihre Antwort. Ich habe Ihren Vorschlag bis Schritt 3 gefolgt und die Sub-URL erhalten, aber wenn ich versuche, es mit WebClient.DownloadFile (URL, Dateiname) zu downloaden, bekomme ich eine "Es tut mir leid, Datei nicht gefunden" -Seite anstelle der Datei. Das Laden der Sub-URL im Browser erzeugt auch dieselbe Seite. – Sami

+0

@sami scheint, als ob der Quellserver nach der Verweis-URL oder dem Header sucht, der vom selben Server stammen sollte –