する必要がある:
1. http ログの大きなファイルを分析する
- mapreduce を使用することを考えていますが、どこにホストすればよいかわかりません。App Engine Mapper または EC2+MapReduce を使用するか、それとも単に VPS で使用するか?
- MapReduce 以外の提案はありますか?
2.結果の保存とクエリ
- すべてのデータを分析したら、それを保存して、可能な限り最良の方法でユーザーに提示する必要があります。結果はどのように保存すればよいですか?MongoDB はこれに適したソリューションですか?
ありがとう。
よろしく。