2010-02-19 4 views

Antwort

3

Aus einem Zend-Hintergrund kommend, empfehle ich generell, Zend_Search_Lucene zu verwenden. Das XPDF Beispiel ist wirklich geradlinig und sieht einfach aus. XPDF ist als GPL lizensiert - wenn das zu deinem Bedarf passt, gehe auf Platz 1!

ZF kann problemlos in Ihre Symfony-Projekte integriert werden, z. für eine Twitter Call.

2

Es gibt viele Bibliotheken zum Extrahieren von Textinhalt aus PDF. Mit diesen müssen Sie dann ein Lucene-Dokument mit dem Inhalt erstellen. Die nützlichsten werden jene sein, die bereits eine Lucene-Integration haben.

Apache PDFBox kann create a lucene Dokument direkt aus PDF-Datei. Es enthält PDF-Metadatenfelder sowie Textinhalte.