Hadoop Distributed File Systems から入力ファイルを読み取る DSE Graph Loader を使用しています。
データを dse グラフ クラスタ (複数のマシン上) に分散して挿入したいのですが、どのようにすればよいですか?
Hadoop Distributed File Systems から入力ファイルを読み取る DSE Graph Loader を使用しています。
データを dse グラフ クラスタ (複数のマシン上) に分散して挿入したいのですが、どのようにすればよいですか?
DSE Graph Loader は、CSV、テキスト、JSON、Gryo、HDFS、AWS S3 ソースなど、多くのソースからのデータのロードをサポートするコマンド ライン ユーティリティです。Hadoop/Spark ジョブとして実行することはできません。
複数のスレッドで注入を並列化するには、パラメーターload_threads (デフォルト 1) を構成します。ドキュメントは次の場所にあります: DSE Graph Loaderの構成