2016-05-16 2 views
0

unter Windows 7 in Chargen- und xidel I wie in diesem Beispiel mit Paginierung auf einer Website zu testen:xidel Wie folgt man Paginierung HTML und URL extrahieren?

link1

link2

link3

2 3 4 5 6 7 8 9 10 Weiter

Ich finde einen Weg, die ersten 10 Links zu haben:

xidel.exe https://www.website.es/search?q=xidel+follow+pagination^&start=0 --extract "//a/extract(@href, 'url[?]q=([^&]+)&', 1)[. != '']" 

aber wenn ich versuche, mit

-f "<A class="fl">{.}</A>" 

oder

--follow "//a/[@class='nav']" 

nothink Arbeit zu Seite 2 oder Seite (n) zu folgen, können Sie mir etwas Hilfe geben oder ein Beispiel?

Danke.

Antwort

1

Reino hat Recht. Aber die Abfrage von Google kann auch so gemacht werden:

xidel -s "https://www.google.com"^
     -f "form(//form,{'q':'xidel follow pagination','num':'25'})"^
     -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]" 
+0

danke, perfekt. – jhonitalia

2
xidel-0.9.5.4998.exe -s^
        "https://encrypted.google.com/search?q=xidel+follow+pagination&start=0"^
        -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]"^
        -f "(//td/a/@href)[last()]"^
        -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]" 

oder

xidel-0.9.5.4998.exe -s --user-agent "Xidel"^
        "https://encrypted.google.com/search?q=xidel+follow+pagination&start=0"^
        -e "//h3[@class='r']/a/extract(@href,'=(.+?)&',1)"^
        -f "//td[@class='b']/a/@href"^
        -e "//h3[@class='r']/a/extract(@href,'=(.+?)&',1)" 

würde den Trick tun.

+0

danke ... ... ... – jhonitalia