Ich habe eine XML-Datei, die eine Codierung angibt, und ich verwende UnicodeDammit, um es in Unicode zu konvertieren (aus Gründen der Speicherung kann ich es nicht als String speichern). Ich übergebe es später an lxml, aber es weigert sich, die in der Datei angegebene Codierung zu ignorieren und es als Unicode zu analysieren, und es löst eine Ausnahme aus.Gibt es eine Möglichkeit, LXML zum Parsen von Unicode-Zeichenfolgen zu zwingen, die eine Codierung in einem Tag angeben?
Wie kann ich erzwingen lxml das Dokument zu analysieren? Dieses Verhalten scheint zu restriktiv zu sein.
Das ganze Problem ist, dass ich nicht einen Baum an erster Stelle bekommen, wenn ich es könnte ich wouldn‘ t haben irgendwelche Probleme ... –
@Stavros Korokithakis, etree ist Modul, nicht der geparste Baum. –
@Daniel Kluev: Ja, aber "Baum" ist ein Baum. –