2010-08-21 6 views
5

Ich habe OpenLink Virtuoso seit einiger Zeit als RDF-Speicher verwendet und obwohl es mit großen Daten großartig ist, bin ich nicht mit der Graph Traversal Leistung mit SPARQL zufrieden. Vor kurzem habe ich viel über die Traversal-Performance von Neo4j gehört und dachte, dass es einen Versuch wert ist. Um einen großen RDF-Store mit guter Traversal-Performance zu haben, ist es besser, zu Neo4j zu wechseln?Neo4j vs OpenLink Virtuoso

Ich habe keine Ahnung von der Leistung von Neo4j mit großen Daten und gut, der RDF/SPARQL-Teil von Neo4j sieht nicht so ausgereift aus. Vielen Dank für Ihre Zeit.

+0

Bitte diese transitiv Crawl Beispiel sehen, basierend auf SPARQL. Das Backend hat 29 Milliarden + Tripel. Link: http://lod.openlinksw.com/b3s/search.vsp?q=6 –

Antwort

4

Virtuoso "Transitivity in SPARQL" wäre die empfohlene Methode für Graph Traversal. Wir haben auch einen tutorial on Transitivity, der einige Beispielabfragen zur Verfügung stellt. Live-Beispielabfragen zu unseren Instanzen LOD Cloud Cache (30+ billion triples) und URIBurner (500+ million triples) sind ebenfalls verfügbar. Unser Blog-Post auf Virtuoso Transitivity and Graphs for SQL wäre auch eine interessante Lektüre ...

(Beantwortet von Hugh Williams, Openlink Software)

+0

Vielen Dank, ich werde darauf springen. Und noch eine Frage kommt mir in den Sinn, wie reduziert die Abfrage von cURL die Performance im Vergleich zu ODBC oder JDBC? – parsa

0

Können Sie bitte weitere Informationen zu dem bei Virtuoso aufgetretenen Leistungsmerkmal Graph Traversal angeben, sodass wir Ihnen möglicherweise Ratschläge geben können, wie Sie dies verbessern können. Bitte geben Sie auch die Version von Virtuoso an, die verwendet wird?

Mit freundlichen Grüßen

Hugh Williams

Open Software

+1

Hallo Hugh, Ich benutze 6.01.3127 (Opensource-Version) auf einer Ubuntu-Box. Tatsächlich basiert meine Beobachtung mit Virtuoso nicht auf Zahlen, sondern nur auf meinem persönlichen Sinn. Das Diagramm wurde mit dem neuesten DBPedia-Dataset (3.5.1) geladen, und dann wurden Abfragen auf dem SPARQL-Endpunkt über cURL-Bindungen in PHP (lokal) durchgeführt. Ich implementierte eine einfache und klassische Breitensuche mit dem Ziel, die Länge des kürzesten Weges zwischen zwei Knoten zu finden. Also was schlägst du vor? Vielen Dank für Ihre Zeit. – parsa

+1

/@ parsa - SO-Antworten sollen zukünftig nicht als Diskussionsforum dienen. –

0

Ich mag würde den Quellcode und Daten und Konfigurationsdateien sehen, bevor irgendwelche Hinweise bereitstellt. Es ist nicht ungewöhnlich, einen 500-fachen Leistungsunterschied aufgrund von Kleinigkeiten wie einem fehlenden Index oder einer Konfigurationseinstellung zu erhalten. Könnten Sie bitte weitere Einzelheiten angeben, vielleicht über Virtuoso Users mail list?