Ich habe Probleme mit R, 'tm' Paket, um PDF-Dateien einzulesen. Insbesondere versuche ich den folgenden Code auszuführen:Installieren von Pdftotext unter Windows (zur Verwendung mit R, 'tm' Paket)
library(tm)
filename = "myfile.pdf"
tmp1 <- readPDF(PdftotextOptions="-layout")
doc <- tmp1(elem=list(uri=filename),language="en",id="id1")
doc[1:15]
... was mir den Fehler gibt:
Error in readPDF(PdftotextOptions = "-layout") :
unused argument (PdftotextOptions = "-layout")
Ich nehme an, dies auf die Tatsache zurückzuführen ist, dass das pdftotext Programm (Teil von xpdf , http://www.foolabs.com/xpdf/download.html) wurde auf meinem Rechner nicht korrekt installiert, so dass R nicht darauf zugreifen kann.
Was sind die Schritte zur korrekten Installation von xpdf/pdftotext, damit der obige R-Code ausgeführt werden kann? (Ich kenne ähnliche Fragen bereits, aber sie adressieren nicht das gleiche Problem)
Was passiert, wenn Sie 'readPDF' ohne die Option' -layout' aufrufen? –
versuchen Sie, das Paket pdftools zu verwenden. Das vermeidet den Aufwand der Installation von xpdf. – phiver
@Karsten: Ausführen des Codes ohne die Einstellung -layout gibt mir den folgenden Fehler: >>> Fehler in System2 ("pdftotext", c (Steuerelement $ text, shQuote (x), "-"), stdout = TRUE): '' pdftotext '' nicht gefunden <<< – SuperUser01