0

mlcp スクリプトを使用して、合計 727Mio トリプルを表す 2091 個の nquad で構成される RDF データセットをロードしようとしています。これまでにこのコマンドを使用しました:

$ mlcp.sh import -username <myusername> -password <mypwd> -host localhost -  port 8000 -input_file_path /home/to/path/ -output_override_graph http://mynamedgraph -mode local -input_file_type rdf

3205 秒後に表示されたエラーは次のとおりです。デバイスに残されたスペース" (詳細はこちら [1]) . ただし、ディスクにはまだ十分なスペースがあります (残り 28G)。

このコマンドで奇妙なのは、データセット名を渡す場所がわからないことです。

お願いします、私は何を間違っていますか?

TIA [1] https://gist.githubusercontent.com/gatemezing/3dce218a98ae72d2a1b8d3219ecd1fa1/raw/76144ee9740e1ba6f79eb114b9907bbe2ac59a03/mlcp.log

4

1 に答える 1

1

マージの最大サイズがデフォルトの 32Gb に設定されていて、28Gb しかない場合、マージを実行しようとして十分なスペースがない可能性があります。また、マージが失敗した後にディスク容量を確認した場合、マージからのファイルは既にクリーンアップされています。

マージは単一のトランザクションとして処理されることを覚えておくことが重要です。トランザクションの途中で領域が不足すると、マージはロールバックされ、トランザクション中に作成されたファイルは削除されます。

MarkLogic では、マージに対応できる十分な空き容量を確保することをお勧めします。通常、データベースよりも約 50% 大きくなります。

于 2017-02-28T16:40:04.053 に答える