ケトルを介してmongodbソースからmysqlテーブルをロードしています。Mongodb テーブルには 400 万件を超えるレコードがあり、ケトル ジョブを実行すると、最初の読み込みが完了するまでに 17 時間かかります。増分ロードでも 1 時間以上かかります。コミット サイズを増やし、ジョブに割り当てるメモリを増やしてみましたが、パフォーマンスは向上しません。JSON
入力ステップはデータを解析するのに非常に長い時間がかかるため、非常に遅いと思います。私は自分の変革にこれらのステップを持っています
- Mongodb 入力ステップ
- JSON 入力
- ストリングスカット
- フィールド値が null の場合
- 連結フィールド
- 値を選択
- テーブル出力。
postgre から抽出したときと同じ 400 万件のレコードは、mongodb よりもはるかに高速でした。パフォーマンスを向上させる方法はありますか? 私を助けてください。
ありがとう、ディープティ