Ich habe eine XML-Datei wie untenWie XPath in lxml Python-Modul verwenden
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://ezinearticles.com/</loc>
<changefreq>hourly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://ezinearticles.com/submit/</loc>
<changefreq>weekly</changefreq>
<priority>0.3</priority>
</url>
...................
Ich möchte lxml Modul verwenden xpathin URL von allen Tag zu bekommen. Ich habe es wie unten beschrieben implementiert, aber es hat nicht funktioniert. Das Ergebnis ist eine leere Liste
from lxml import etree
parser = etree.XMLParser(ns_clean=True)
xmlfile = "sitemap1.xml"
xmlobj = etree.parse(xmlfile, parser)
loc = xmlobj.xpath('//loc[text()]')
print(loc)
Kann mir jemand helfen, mein Skript zu reparieren?
... gewährt, diese Frage betrifft nicht XHTML, aber es ist genau das gleiche Problem (nur mit zwei verschiedenen Namespaces). –