Wenn ich Webread verwenden scheint es nicht tun, laden Sie die vollständige HTML. Zum Beispiel wird webread ('https://www.youtube.com') die meisten HTML herunterladen. Aber ich möchte, dass HTML heruntergeladen wird, wie es in den Chrome-Entwicklertools zu sehen ist. Weiß jemand, wie man das macht?MatLab Webread nicht herunterladen voll HTML
1
A
Antwort
0
Wenn es geeignet ist, externe Java-Archive zu verwenden, können Sie versuchen, JSoup.
Nachdem Sie downloaded die .jar
Datei haben:
% Add to the JAva classpath
javaaddpath('full_path_to_jsoup_jar');
% Connect tot the specified URL
jSoup = org.jsoup.Jsoup.connect('http://youtube.com');
% Get the DOM
document = jSoupDoc.get();
Dieser Ausschnitt wird das DOM-Dokument von der angegebenen Seite zurück.
Sie können auch die der Proxy -wenn Sie ANY, bevor man den Inhalt als haben:
jSoup.proxy('your_proxy', your_proxy_port)
Es ist möglich, dass Javascript dynamisch Elemente auf das DOM hinzufügt. Da 'webread' kein JavaScript ausführt, werden Sie diese nicht sehen – Suever