ユーザーが 4 つのソーシャル ネットワークからの情報を表示できるように、EC2 インスタンスに Web サイトをセットアップしました。
ユーザーが参加すると、サイトは毎晩情報を更新し、翌日に最新の関連情報を表示する必要があります.
最初に、各ユーザーを通過し、必要な API 呼び出しを実行してから、データを DB (Amazon rds インスタンス) に保存する cron ジョブがありました。
この操作は 1 人あたり 2 ~ 30 秒かかります。つまり、1 つずつ行うと、更新に数日かかることになります。
私はMapReduceを見ていましたが、それが私がやろうとしていることにとって適切なオプションであるかどうかを知りたいのですが、現時点では確信が持てません.
更新したいすべてのレコードと、MapReduce に各レコードの処理方法を指示し、それらすべてを同時に処理させるスクリプトを含む .sql ファイルを MapReduce に渡すことはできますか?
そうでない場合、それを行うための最良の方法は何でしょうか?
事前にご協力いただきありがとうございます。