ここに問題があります。Azure テーブルで約 4,000 万のエンティティを更新する必要があります。単一のインスタンスでこれを行う (選択 -> オリジナルを削除 -> 新しいパーティションキーで挿入) には、クリスマス頃までかかります。
私の考えは、多くのインスタンスが実行されている azure ワーカー ロールを使用することです。ここでの問題は、クエリが上位 1000 レコードを取得することです。1 つのインスタンスでは問題ありませんが、20 のインスタンスを実行すると、それらの選択が明らかにオーバーラップします。これにより、別のインスタンスによって既に削除されたレコードを削除しようとしたり、既に更新されたレコードを更新したりするために、多くの無駄なコンピューティングが発生します。
私はいくつかのアイデアを実行しましたが、私が持っている最良のオプションは、役割がパーティションと行キーでキューを埋めてから、ワーカーがデキューして実際の処理を行うことですか?
より良いアイデアはありますか?