比較的大きなデータセットをneo4jにインポートしようとしています...関係を持つ約5000万のノード。
私は最初に py2neo を介して Cypher を試しました -> これは機能しますが、CREATE UNIQUE または MERGE を使用する必要がある場合は非常に遅くなります。
現在、他のバッチ インポート方法を検討していますが、一般的なワークフローと速度に最適な方法について推奨事項があるかどうか疑問に思っています。
- Neo4j ドキュメントでは、 Java のように見え、Neo4j ディストリビューションの一部であるバッチ挿入機能について言及しています。
- また、Michael Hunger によるバッチインサーターが github にあります。これがディストリビューションに含まれているものとどの程度似ているか、または異なるかはわかりません。
- 次に、現在テスト中のload2neoもあります。
- そして、 Neo v2 の CYPHER の一部としてCSV機能からの負荷がありますが、それが主に便利な要因であるかどうか、およびそのパフォーマンスが、Cypher を介して 40,000 のバッチで Cypher クエリを実行するのと似ているかどうかはわかりません。取引。
これらのオプションの機能、ワークフロー、速度の違いについてコメントをいただければ幸いです。