Ich versuche, einige XML zu analysieren, die in folgendem Format ist:lxml eTree iterparse Tiefe
<label>
<name></name>
<sometag></sometag>
<sublabels>
<label></label>
<label></label>
</sublabel>
</label>
es mit diesem
for event, element in etree.iterparse(gzip.GzipFile(f), events=('end',), tag='label'):
if event == 'end':
name = element.xpath('name/text()')
Parsing produziert leer Name Variable wegen der
<sublabels>
<label></label>
<label></label>
</sublabel>
Die Frage:
Gibt es eine Möglichkeit, die Tiefe der Iterparse festzulegen oder die Beschriftung der Sublabel zu ignorieren, außer zu prüfen, ob sie leer ist?
Die Datei ist riesig. Das Loch Ding sofort zu parse ist keine Option. – abruski