2016-08-09 40 views
2

Ich versuche derzeit PyPDF2 zu verwenden, um die PDF-Datei in der Python zu lesen. Ich möchte wissen, ob der Text der PDF-Datei markiert ist oder nicht.Suche nach Text, ob es markiert ist oder nicht

Kontext:

Wir verwenden Text in PDF-Datei mit einem anderen color.Is markieren es eine Möglichkeit, zu wissen, welcher Text in Python hervorgehoben jede Bibliothek oder so? Wenn es mich bitte an die richtige Quelle leiten soll.

Ich sehe in viele Orte für dieses Problem.Was ich gefunden habe, ist PyPDF2 kann dieses Problem nicht lösen?

+0

Ich bin auch auf der Suche nach dem gleichen. – K246

Antwort

0

In PyPdf2 können Sie ein pageObject verwenden, das ein Wörterbuch ist. Sie können dann nach key = '/ Annots' und seinen Werten suchen. Sie können zumindest wissen, ob auf der Seite Text hervorgehoben ist oder nicht.