Ich habe versucht, ein PDF von einer Webseite zu bekommen, analysieren Sie es und drucken Sie das Ergebnis auf den Bildschirm mit PyPDF2. Ich habe es ohne Probleme mit dem folgenden Code arbeiten:Python 3 parse PDF aus dem Web
with open("foo.pdf", "wb") as f:
f.write(requests.get(buildurl(jornal, date, page)).content)
pdfFileObj = open('foo.pdf', "rb")
pdf_reader = PyPDF2.PdfFileReader(pdfFileObj)
page_obj = pdf_reader.getPage(0)
print(page_obj.extractText())
eine Datei zu schreiben, nur damit ich es dann gelesen, obwohl verschwenderisch klang, so dachte ich, ich würde nur die Zwischenhändler mit diesem Schnitt:
pdf_reader = PyPDF2.PdfFileReader(requests.get(buildurl(jornal, date, page)).content)
page_obj = pdf_reader.getPage(0)
print(page_obj.extractText())
Dies gibt mir jedoch eine AttributeError: 'bytes' object has no attribute 'seek'
. Wie kann ich die PDF von requests
direkt auf PyPDF2 füttern?
Entschuldigung, ich habe vergessen zu erwähnen, ich brauche es Python3 kompatibel –