2012-03-26 4 views
0

Wir haben XML-Dateien in einer eXist-db XML-Datenbank gespeichert, die indiziert und in Solr gespeichert werden müssen. Die Dokumentation erwähnt nicht viel. Wenn jemand hier weiß, bitte helfen Sie. Sehr geschätzt!Solr und eXist-db Integration

+0

Eine nahezu identische Frage wurde nur in der XML und verwandte Technologien Netzwerkgruppe auf Linkedin gefragt: http://www.linkedin.com/groupAnswers?viewQuestionAndAnswers=&discussionID = 100978256 & gid = 71299. Wenn das nicht Ihre Fragen beantworten, würde ich Sie begrüßt die exist offene Mailingliste beitreten und eine spezifischere Beschreibung Ihrer Anforderungen senden. Mehr eXist-db Benutzer sind auf exit-open als hier, also ist das Ihre beste Wette. – joewiz

Antwort

0

Sie Solr die verwenden können URLDataSource eXist-db mit REST zuzugreifen. Anstatt Daten an Solr zu übertragen, verwenden Sie Solrs DataImportHandler, um die Daten von eXist zu lesen und mit zu formatieren.

Wie XML-Ressourcen von eXist GET: http://exist-db.org/exist/devguide_rest.xml

+0

Danke für die Antwort. Die REST-Schnittstelle funktioniert, aber XPathEntityProcessor kann nicht mehrere Dokumente erstellen, wenn sie verschachtelt sind. Wir hatten den Eltern-XPathEntityProcessor, um an der eXist-DB-Sammlung zu arbeiten. Der untergeordnete XPathEntityProcessor arbeitet mit den einzelnen XML-Dateien. –

+0

Wenn Sie keine der verfügbaren Einheit Prozessoren erhalten können mit Ihren Daten arbeiten, vielleicht sollten Sie prüfen, [Ihr eigenes Schreiben] (http://wiki.apache.org/solr/DataImportHandler#EntityProcessor) durch die Verlängerung [EntityProcessorBase] (http : //lucene.apache.org/solr/api/org/apache/solr/handler/dataimport/EntityProcessorBase.html) und überschreibt die Methode nextRow(). –

+0

Oder auch in Ihrem Fall besser, durch die Erweiterung [XPathEntityProcessor] (http://lucene.apache.org/solr/api/org/apache/solr/handler/dataimport/XPathEntityProcessor.html). –

0

Wir haben etwas ähnliches getan, aber nicht von eXist DB. Sie haben ein paar Optionen können Sie:

  • die XML-Transformation, die von Ihrer DB in die XML format that SOLR likes ausgegeben wird
  • einen Skript schreiben, mit XSTL zur Ausgabe von Ihrer DB und Import CSV (oder JSON) zu konsumieren in SOLR
  • vorausgesetzt, es gibt ein JDBC-Treiber für eXist DB ist, verwenden Sie die SOLR data import handler