Ich versuche eine Web-App zu schreiben, um Referenzen für meine Doktorarbeit zu verwalten.Extrahieren von Text aus einem PDF mit JBoss Richfaces
Ich habe diese Informationen in einer persönlichen Confluence (fantastisches Tool! - http://www.atlassian.com/software/confluence/) Instanz verwaltet, aber ich bin satt mit dem Öffnen von PDFs und Ausschneiden und Einfügen von Werten in Felder, die ich aufnehmen möchte.
Ich habe einen Webservice veröffentlicht, der mir Bilder basierend auf einem PDF-Dateinamen und einer Seitennummer zurückgibt. Derselbe Webservice stellt auch eine Methode bereit, die den Text innerhalb eines bereitgestellten Rechtecks zurückgibt (oben links x-y-Koordinate, unten rechts x-y-Koordinate).
Ich möchte in der Lage sein, ein Rechteck über einen Teil des PDF-Bildes ziehen und dann den Webservice anrufen, um mir den Text (die ich dann auf einer EntityBean speichern). Ich untersuche den JBoss Application Stack (Application Server, Hibernate, Seam und Richfaces). Weiß jemand, wie ich das erreichen könnte? Ich habe die Fähigkeit gesehen, benutzerdefinierte Bilder in anderen RIA-Toolkits (z. B. Dojo) zu zeichnen, aber ich sehe keine Möglichkeit, dies in Richfaces zu tun.
Hoffentlich könnte jemand da draußen mich verraten oder eine Idee darüber geben, was ich tun kann (da ich kein Webentwickler bin - ich baue hauptsächlich dieses Tool, weil die jetzt verfügbaren RIA-Frameworks mich interessiert haben!)
Ich habe bereits den Code, um den Text zu extrahieren, mein Problem ist rein wie kann ich den Benutzer dazu bringen, ein "Auswahlrechteck" innerhalb des Webbrowsers über den oberen Rand des Bildes zu zeichnen?
Vielen Dank,
Aidos