Ich stoße auf ein Problem, es könnte sehr einfach sein, aber ich habe es nicht auf dem Dokument gesehen.Python BeautifulSoup nur Top-Tag auswählen
Hier ist die Ziel-HTML-Struktur, sehr einfach.
<h3>Top
<em>Mid</em>
<span>Down</span>
</h3>
Ich möchte die „Top“ Text erhalten, die innerhalb des h3
Tag war, und ich schrieb dieses
from bs4 import BeautifulSoup
html ="<h3>Top <em>Mid </em><span>Down</span></h3>"
soup = BeautifulSoup(html)
print soup.select("h3")[0].text
Aber es wird Top Mid Down
zurückkehren, wie ändere ich das?
Danke, ich werde mehr Details über 'contents' und' children' auschecken –