2016-07-28 5 views
1

Wenn ich Webread verwenden scheint es nicht tun, laden Sie die vollständige HTML. Zum Beispiel wird webread ('https://www.youtube.com') die meisten HTML herunterladen. Aber ich möchte, dass HTML heruntergeladen wird, wie es in den Chrome-Entwicklertools zu sehen ist. Weiß jemand, wie man das macht?MatLab Webread nicht herunterladen voll HTML

+1

Es ist möglich, dass Javascript dynamisch Elemente auf das DOM hinzufügt. Da 'webread' kein JavaScript ausführt, werden Sie diese nicht sehen – Suever

Antwort

0

Wenn es geeignet ist, externe Java-Archive zu verwenden, können Sie versuchen, JSoup.

Nachdem Sie downloaded die .jar Datei haben:

% Add to the JAva classpath 
javaaddpath('full_path_to_jsoup_jar'); 

% Connect tot the specified URL 
jSoup = org.jsoup.Jsoup.connect('http://youtube.com'); 
% Get the DOM 
document = jSoupDoc.get(); 

Dieser Ausschnitt wird das DOM-Dokument von der angegebenen Seite zurück.

Sie können auch die der Proxy -wenn Sie ANY, bevor man den Inhalt als haben:

jSoup.proxy('your_proxy', your_proxy_port)