テキスト ファイルから JSON オブジェクトを解析し、それらを MongoDB に永続化する必要があるという要件があります。
いくつかの詳細 -
- ファイル サイズ ~ 1-10 MB、#json オブジェクト ~ 100 k、単一の json オブジェクトのサイズは非常に小さい..
- Mongodb クラスター (シャーディングおよびレプリケート)
- パフォーマンス - 時間は貴重です..
- ファイル全体を解析して検証しない限り、mongodb コレクションにオブジェクトをダンプすることはできません。
- 私のアプリは J2EE スタック (Spring 3.2) を使用しています
だから今、mongodbに一括挿入する前に保存する必要がある100万個のJavaオブジェクトがあります..(mongodbはシャードされています..パフォーマンスを向上させるために事前に分割する必要があります)
私の質問は、これを効率的にするにはどうすればよいですか? 私が考えたいくつかの方法 -
- オブジェクトをシリアライズしてファイルに保存します。(問題: IO 時間)
- スタンドアロンの非シャード mongo で一時コレクションを作成してから、必要なコレクションに一括挿入します (#1 よりも見栄えがします)。
誰かが同様の問題について彼女の経験を共有できますか..? 他の情報が必要な場合はお知らせください..