2015-05-08 6 views
5

Ich habe viel geforscht (ich denke nicht genug?) Und versuche eine einfach zu benutzende Bibliothek zu finden, um die Seitenzahl eines PDFs mit Node.js zu finden. Die Bibliothek müsste unter einem Windows-Betriebssystem verwendbar sein.PDF-Seitenanzahl mit Knoten (unter Windows) finden

Wer weiß, wie man das am besten angeht? Im schlimmsten Fall dachte ich darüber nach etwas mit PhantomJS und der PDF.js Bibliothek zu machen.

Danke für jede Hilfe !!

+0

https://github.com/mozilla/pdf.js/blob/master/examples/node/getinfo.js? – async5

Antwort

5

Da es auf pdf.js, pdf2json gebaut ist, sollte es in Windows funktionieren.

ich es geschafft, die Seitenzahl eines Testdokuments wie so zu finden:

var PDFParser = require('pdf2json'); 
var pdfParser = new PDFParser(); 

pdfParser.on('pdfParser_dataReady', function(data) { 
    var doc = data.PDFJS && data.PDFJS.pdfDocument && data.PDFJS.pdfDocument.numPages; 
    console.log('Number of pages:', doc); 
}); 
// pdfParser.on('pdfParser_dataError', _.bind(_onPFBinDataError, self)); 

pdfParser.loadPDF('test.pdf'); 
+1

Von den wenigen Lösungen, die ich mir angesehen habe, war dies die erste Lösung, die für mich funktionierte (mit Node on Mac). Ich musste auf die Anzahl der Seiten zugreifen mit: 'data.formImage.Pages.length'. Ich bin mir nicht sicher, ob es einen besseren Weg gibt, aber die gegebene Lösung ('data.PDFJS && ...') hat für mich nicht sofort funktioniert. Wie auch immer, +1! :) – mhulse

+0

Ah, das hat auch funktioniert: 'console.log (parser.PDFJS && parser.PDFJS.pdfDocument && parser.PDFJS.pdfDocument.numPages);'. Das 'Parser'-Objekt enthält also die' numPages'. Interessant! – mhulse