私は Neo4j Server 2.3.2 バージョンを使用しており、Unmanaged プラグインを使用して非構造化データを解析し、グラフにロードしています。
それをしている間、ノードが重複し、シーケンシャル処理のスループットが遅い(バッチ処理でも)という状況に陥りました。繰り返しのデータ ロードのユース ケースを考慮して、次のいずれかを使用して (サーバー プラグインを使用して) 並列データ処理を求めます。
ファイルを分割する
分割加工・ねじ切り
現在、並列の日付読み込みで、私が予測できる最大の課題は、重複するノードの作成を回避する方法など、データの整合性の問題に対処することです。Neo4j の参考資料を読んでいると、独自のノードを作成する次のオプションが見つかりました。
オプション:
[推奨] Cypher と一意の制約を使用して一意のノードを取得または作成する
[その他] Java API からの悲観的ロック
[その他] 従来のインデックスを使用して一意のノードを取得または作成する
さて、問題は、Java API を使用してこの一意の制約をどこから適用できるかです。キャプチャして制約を適用できるイベント情報を探しています。いくつかのイベント/メソッドをロード/呼び出すための最良の方法を教えてください。そこに制約を適用するためのコードを挿入します。
また、任意のエンティティが作成される前に、Cipher を使用してこの独自の施行を定義する方法はありますか。
前もって感謝します
参考文献: