Ich versuche ein kleines Programm zu erstellen, in dem ich ein docx Dokument öffne und Zeichen durch andere ersetze, um eine alte Schule-caesar-artige Verschlüsselung zu tun, nachdem ich die Dokumentation überprüft habe: [https://python-docx.readthedocs.io] Ich bin Ich fürchte, ich kann die Objektmethoden und -attribute nicht finden, die Dokumentation erklärt nur irgendwie, wie man bestimmte Dinge wie das Erstellen von Absätzen und Abschnitten tut, aber ich kann nichts über das Abrufen von Dokumentdaten und das Parsen finden. Ich möchte eine Liste der Objekte im Dokument finden, damit ich sie analysieren kann.python-docx - Ersetzen von Zeichen
Ich möchte so etwas wie dies tun:
from docx import Document
document = Document('essay.docx')
paragraph = []
for i in document:
paragraph.append(i)
for i in paragraph:
for y in i:
y.replace("a", "y")
...
Kann python-docx so etwas tun? Wenn ja, wo finde ich die Dokumentation, die mir zeigen könnte, wie es geht?
Wenn ich vielleicht die falsche Bibliothek benutze, würde ich es auch schätzen, wenn Sie darauf hinweisen könnten.
Ja, ich las auch die Seiten und ich fand Methoden wie „add_paragraph()“ und „add_run()“ aber ich nicht Methoden wie finden konnte „get_paragraph()“. Ich muss Objekte durchforsten und modifizieren, um eine neue Datei zu erstellen. Vielleicht funktioniert diese Bibliothek nur zum Erstellen von docx-Dokumenten, aber nicht zum Abrufen von Daten von ihnen? – andrralv
Suchen Sie im Document-Objekt. Ich glaube, du suchst nach "Document.paragraphen". – scanny
Es scheint zu hackig, um eine Antwort zu sein, aber Sie können Word-Dokumente tatsächlich entzippen und gibt unter anderem ein Textdokument mit dem unformatierten Text zurück. Ich bin nicht vertraut mit dieser Bibliothek, aber im schlimmsten Fall können Sie ein Dienstprogramm verwenden, um es zu entpacken, dann den Text lesen, die nicht benötigten Teile löschen und dann diese Bibliothek verwenden, um das gewünschte Dokument zu erstellen. – Jeff