ですから、この問題を Google App Engine の mapreduce フレームワークでどのように機能させることができるのか、または実際に機能させることができるのか疑問に思っていました。複数の部分に分割され、Google クラウドに保存されている入力ファイルがあります。ここで、分割されたすべての部分で同じ Python コードを実行し、それを 1 つの出力ファイルに順番に結合したいと考えています。入力ファイルを分割せずにコードを実行すると、約 20 分かかります。
基本的に map-shuffle-reduce モデルがわかりません。誰かが私にそれを説明できれば素晴らしいことです。ありがとう!