Ich bin auf der Suche nach einer sehr schnellen, leichten Python-Bibliothek zum Lesen von PDF-Metadaten. Ich brauche keine Schreibfähigkeiten. Es wäre besser, wenn nur die Metadateninformationen geladen werden, nicht die gesamte Datei.Fast Python PDF-Metadaten-Reader
Ich realisiere eine interpretierte Sprache wie Python ist nicht die beste Wahl für die Geschwindigkeit, aber da diese Lösung plattformübergreifend sein und mit einer bestehenden Python-Anwendung arbeiten muss, scheint es keine große Wahl zu sein.
Ich habe pyPdf und einige andere Bibliotheken ausgecheckt, bin aber im Idealfall auf der Suche nach etwas leichter und schneller, geeignet für die Verarbeitung von Zehntausenden von Dateien in einem Rutsch.
Vielen Dank.
Was, wenn überhaupt, macht pyPdf zu schwer? Wenn Sie nur schreiben müssen, importieren Sie PdfWriter nicht. – bdd
Die Lib selbst ist ziemlich leicht, aber sie liest die gesamte Datei. Dies bedeutet, dass die Verarbeitung größerer PDFs länger dauert, im Fall von großen Dateien wie Handbüchern ist es sehr langsam. –