2016-06-04 23 views
1

ich von R. eine HTML-Datei mit einer URL speichern möge ich versucht habe, nach der Verwendung von GET und read_html Funktionen von httr das Antwortobjekt (en) speichern und rvest Pakete, auf der URL der Website möchte ich den HTML-Code speichern. Das hat aber nicht funktioniert, um den eigentlichen Inhalt der Website zu speichern.R - Schreiben Sie eine HTML-Datei von URL/HTML Object/HTML-Antwort

url = "https://facebook.com" 
get_object = httr::GET(url); save(get_object, "file.html") 
html_object = rvest::read_html(url); save(html_object, "file.html") 

Keines dieser Arbeit der korrekte Ausgabe zu speichern (das heißt, der HTML-Inhalt der Webseite in einer HTML-Datei) von der eigentlichen Website in der HTML-Datei.

+0

Was ist die „richtige“ ausgegeben und was erhalten Sie? – cory

+0

Die richtige Ausgabe, die ich suche, ist der HTML-Inhalt der Webseite in der 'file.html' Datei Ich bekomme etwas Müll in der' file.html' Datei. – RNoobie

Antwort

3

Verwenden Sie str(object), um herauszufinden, woran Sie arbeiten. In beiden Fällen haben Sie versucht, Nicht-Text in eine Textdatei zu schreiben.

Hier ist, wie Sie den Text erhalten und schreiben Sie es Ihre beiden Bibliotheken ...

url = "https://facebook.com" 

library(httr) 
get_object = GET(url) 
cat(content(get_object, "text"), file="temp.html") 

library(rvest) 
html_object = read_html(url) 
write_xml(html_object, file="temp.html")