Amazon Mechanical Turk API を使用して、一括タスクの単一バッチではなく一連のタスクを処理するソリューションをどのように設計すればよいでしょうか?
詳細は次のとおりです。
私たちのアプリは、1 日あたり約 1,000 枚の写真とビデオのストリームを受信します。各写真またはビデオには、転記する必要がある 6 ~ 8 個の数字 (電子デバイスのシリアル番号) と、転記の「確実性レベル」 (「確実」、「不明」、「読めない」など) が含まれています。 」)。文字起こしは画像ごとに 10 秒未満、動画ごとに 20 秒未満で済み、必要なスキルやトレーニングは最小限です。
私たちのアプリは、これらの画像を 1 日中継続的にアップロードするので、数分以内にそれらの画像を数値に変換したいと考えています。理想的な解決策は、毎分新しいタスクをアップロードし (ピーク時には 1 分あたり 20 件未満)、結果も毎分ダウンロードすることです。
2 つの質問:
- 迅速なターンアラウンド タイム、精度、費用対効果のバランスを適切に保つには、一度に 1 つのタスクを送信する必要がありますか、それともタスクをバッチ処理するのが最適ですか? もしそうなら、バッチサイズを設定する際に考慮すべき変数は何ですか?
- MTurk API をラップして、HIT 生成が 1 回限りではなくストリーミングで進行中の私たちのようなユースケースをより簡単に処理するライブラリまたはホストされたサービスはありますか?
初心者の質問で申し訳ありません。Mechanical Turk は初めてです。