Ich möchte eine große Anzahl von PDF-Dokumenten indizieren. Ich habe eine Referenz gefunden, die zeigt, dass es mit Apache Tika gemacht werden kann, aber leider kann ich keine Referenz finden, die bes
Ich laufe Solr 1.4 auf Ubuntu 10.04 (installiert über apt-get solr-tomcat) und es scheint gut zu funktionieren. Ich habe Schwierigkeiten, kohärente Informationen darüber zu finden, wie man Dokumente i