2

MLCP を使用しているときに、あるデータベースから別のデータベースにドキュメントをコピーするときに、オプション ファイル (options.txt) で指定された「-batch_size」オプション奇妙な問題が発生し ました。提供される基本フィルタリング オプション) は106で、次のコマンドを実行します。 mlcp.bat -options_file "options.txt"

受信した Content Pump 統計は次のとおりです。

 INFO contentpump.LocalJobRunner:com.marklogic.mapreduce.ContentPumpStats:
 INFO contentpump.LocalJobRunner: INPUT_RECORDS: 106
 INFO contentpump.LocalJobRunner: OUTPUT_RECORDS: 106
 INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_COMMITTED: 100
 INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_FAILED: 0
 INFO contentpump.LocalJobRunner: Total execution time: 37 sec

バッチ処理 (バッチ サイズ = 10) 後に残された残りのドキュメントは10*10 + 6であり、6 つのドキュメントは目的のデータベースに転送されていないようです。

したがって、どういうわけか、完全なバッチに該当するドキュメントのみを転送し、完全なバッチを形成できない残りのドキュメントは転送しません。

誰かがこれの回避策とこの動作の原因を提案できますか?

4

1 に答える 1

1

「不足している」文書が宛先データベースにあるかどうかを確認しましたか?

しばらくの間 (少なくともインポートでは) バグがあり、動作は正しいにもかかわらず、統計が時々正しくないことがありました。この問題は mlcp v8.0-4 で修正されました。

もう 1 つ確認することは、宛先サーバーにエラーが記録されていないことです。OUTPUT_RECORDS < OUTPUT_RECORDS_COMMITTED は、ここで説明するように、一部のコミットが失敗したサーバー側のエラーが発生したことを示している可能性があります。

http://docs.marklogic.com/guide/mlcp/getting-started#id_33299

最後に、どのフィルターを使用していますか? -query_filter は、フィルタリングされていない検索を使用するため、誤検知を引き起こす可能性があります。これがあなたが遭遇しているものとは思えませんが、言及する価値があると思いました. それはここで話されています:

http://docs.marklogic.com/guide/mlcp/export#id_85989

于 2016-07-07T18:45:23.013 に答える