2016-06-08 11 views
0

Ich versuche einen großen Datensatz nach neo4j zu importieren. Ich habe ein Python-Skript erstellt, um die Cypher-Abfragen nach dem Lesen einer .xls-Datei in eine .cql-Datei zu schreiben, und dann habe ich sie mit der neo4j-Shell ausgeführt. Dies funktionierte für einen kleinen Datensatz. Aber beim Vergrößern der Datenmenge stürzte mein System für dasselbe ab.Alternative zum Batch-Importer für neo4j für große Datensätze

Ich habe einige Vorschläge zur Verwendung von Batch-Importer gesehen, aber sie basieren in der Regel in Java (zB: Groovy) und es ist etwas, das ich nicht gerne benutze. Gibt es eine Alternative zum Batch-Einfügen oder zumindest Batch-Einfügen über Python?

+0

ich das Neo4j-Import-Tool verwenden würde. http://neo4j.com/docs/operations-manual/current/#import-tool –

+0

Funktioniert gut, aber nur eine Sache muss ich IDs für alle Spalten erstellen, um in Beziehungen beizutreten? Ich habe die Dokumentation nicht verstanden über: ID und: IGNORE, dass gut..So wenig Hilfe wäre nett –

Antwort

1

Sie könnten versuchen, die Neo4J laden CSV Werkzeug/cypher Befehl. Es ist sehr flexibel und kann mit dem USING PERIODIC COMMIT verwendet werden, um sehr große Datasets zu verarbeiten, indem periodische Commits gemacht werden, um Pufferüberlaufprobleme zu verhindern und den Prozess weiter zu optimieren.

Die einzige Voraussetzung ist, dass Sie Ihre Originaldaten im CSV-Format exportieren können.

http://neo4j.com/developer/guide-import-csv/

http://neo4j.com/docs/developer-manual/current/#cypher-query-lang (Abschnitt 8,6)

+1

mehr die Last csv ..neo4j Import funktioniert besser speziell auf Windows .. http://neo4j.com/docs/operations-manual/current/#powershell-windows –