大量のファイルを次のように処理しています。最初にすべてのファイルをEC2インスタンスにダウンロードしてから、各ファイルを順番に処理してDynamoDDBテーブルにインデックスを付けるスクリプトを実行します(テーブルの各アイテムは1行に対応します)ファイル内)。次に、ファイルなどの次のバッチをダウンロードします。
現在、AWS GUIコンソールを介してプロビジョニングされたスループットを調整していますが、ダウンロードフェーズとインデックス作成フェーズの両方で同じになります。明らかに、これは最適ではありません。ダウンロード中はデータベースとまったく通信しないため、このフェーズで必要な書き込みスループットは基本的に0です。
したがって、私がやりたいのは、インデックス作成を開始するときにプロビジョニングされたスループットをプログラムで調整し、インデックス作成を停止してダウンロードを開始するときにプログラムで調整することです。
1回のリクエストで書き込みt/pをどれだけ増やすことができるかについて制限はありますか?たとえば、5から120に変更できますか?そうでない場合、リクエストの数とt / pを値Xから値Y(X << Y)に調整するために必要な時間を計算するにはどうすればよいですか?t / pを減らすために同様の計算を行う必要がありますか?
Pythonbotoを使用しています。
ありがとう