Ich muss txt-Dateien mit XML-Markup in einem Verzeichnis analysieren (ich habe bereits einen Korpus mit glob erstellt), aber Etree Parse erlaubt nur eine Datei zu einem Zeitpunkt. Wie richte ich eine Schleife ein, um alle Dateien gleichzeitig zu analysieren? Das Ziel besteht dann darin, diese Dateien mithilfe von Anfragen zu Elasticsearch hinzuzufügen. Das ist, was ich habe, so weit:Vollständiges Verzeichnis analysieren Etree Parse lxml
import json
import os
import re
from lxml import etree
import xmltodict
import glob
corpus=glob.glob('path/*.txt')
ns=dict(tei="http://www.tei-c.org/ns/1.0")
tree = etree.ElementTree(file='path/file.txt')
doc = {
"author": tree.xpath('//tei:author/text()', namespaces=ns)[0],
"title": tree.xpath('//tei:title/text()', namespaces=ns)[0],
"content": "".join(tree.xpath('//tei:text/text()', namespaces=ns))
}
Sind Sie fragen, wie ein for-Schleife zu schreiben? –