Ich lerne Python und BeautifulSoup, um Daten aus dem Internet zu kratzen, und lese eine HTML-Tabelle. Ich kann es in Open Office lesen und es heißt, dass es Tabelle 11 ist.Wie erhalten Sie alle Zeilen aus einer bestimmten Tabelle mit BeautifulSoup?
Es scheint wie BeautifulSoup ist die bevorzugte Wahl, aber kann mir jemand sagen, wie man einen bestimmten Tisch und alle Reihen ergreift? Ich habe mir die Moduldokumentation angeschaut, kann mich aber nicht darum kümmern. Viele der Beispiele, die ich online gefunden habe, scheinen mehr zu tun, als ich brauche.
Das war der Trick! Der Code funktionierte und ich sollte ihn nach Bedarf ändern können. Danke vielmals. Eine letzte Frage. Ich kann dem Code folgen, außer wenn Sie die Tabelle für Kinder th und tr suchen. Sucht das einfach meine Tabelle und gibt sowohl den Tabellenkopf als auch die Tabellenzeilen zurück? Wenn ich nur die Tabellenzeilen haben wollte, könnte ich einfach nur nach tr suchen? vielen dank nochmal! – Btibert3
Ja, '.findChildren (['th', 'tr'])' sucht nach Elementen mit dem Tag-Typ 'th' oder' tr'. Wenn Sie nur 'tr' Elemente finden möchten, würden Sie' .findChildren ('tr') 'verwenden (no not list, nur die Zeichenfolge) –
Es lohnt sich auch zu beachten, dass [PyQuery] (https://pythonhosted.org /pyquery/api.html) ist eine wirklich sehr schöne Alternative zu BeautifulSoup. –