2016-06-16 1 views
0

Ich bin mit XML und RCurl Pakete in R die Daten von der ersten Seite werden meine xpathSApply ArgumenteErste erster Linie die Suchergebnisse von Google

site <- getForm("http://www.google.com/search", hl="en",lr="", q="life of pi", btnG="Search") #q-> query 
    doc<-htmlParse(site, asText=TRUE) 
    plain.text <- xpathSApply(doc, "//text()[not(ancestor::script)][not(ancestor::style)][not(ancestor::noscript)][not(ancestor::form)]", xmlValue) 

Was sollte zu bekommen, damit ich nur die ersten Zeilen des Such bekommen Ergebnisse (die, die in Blau mit einer größeren Schrift)

Antwort

0

Vielleicht mit dem Header oder andere Tags beginnen, bevor nicht (Vorfahre) Sachen

xpathSApply(doc, "//h3", xmlValue) 
[1] "LIFE OF PI - Buy it on Digital HD, Blu-ray & DVD" 
[2] "Life of Pi - Wikipedia, the free encyclopedia" 
[3] "Life of Pi (film) - Wikipedia, the free encyclopedia" 
[4] "Images for life of pi" 
[5] "Life of Pi (2012) - IMDb" 
... 
+0

das ist genau das versuchen, was ich brauchte. Vielen Dank. –