Hadoop と MapReduce フレームワークを学んでいます。これまで、私はテキスト ファイルをいじり、MapReduce フレームワークを利用してそれらを処理してきました。
MapReduce の学習を始めたとき、最初によく使われる例として、テキスト ファイル処理シナリオである WORDCOUNT を見つけました。次に、いくつかのテキスト ファイルを処理して結果を表示する独自のロジックを作成しました。その場合は成功しました。
しかし、別の形式の入力に進む必要があります。現実の世界では、テキスト ファイルだけを処理するわけではないからです。MapReduce フレームワークを使用して、画像、オーディオ、ビデオなどのさまざまな形式の処理を検討する必要があります。しかし、私の目的に役立つ適切な例を見つけるのに苦労しています。テキストからビデオまで、さまざまな形式の入力を使用した MapReduce の例とチュートリアルが必要です。
編集:
つまり、画像、ビデオ、およびオーディオを処理するということです。テキストファイルだけではありません。
編集2:
例: サイズが 450GB の 10 年間の .bmp イメージ (圧縮と解凍が含まれていない場合) があるとします。フォルダー内のすべての画像を分析する必要があり、類似した画像を表示する必要があります (ピクセルの類似パターンを比較することにより)。そして、「From」「To」の日付の間に作成/変更された画像をリストする必要があります。その一連の画像で、2013 年 1 月から 2013 年 2 月の間に作成/変更された画像とします。どうすればこれを達成できますか??
誰かが私が正しい道を歩むのを手伝ってくれたら嬉しいです!!