5

フレームワーク、フレームワークの組み合わせ、ベスト プラクティス、Hadoop を使用した大規模なデータ セットの視覚化に関するチュートリアルを探しています。

Hadoop ジョブの実行や Hadoop のディスク領域の管理の仕組みを視覚化するためのフレームワークを探しているわけではありません。グラフやチャートなどを使用して、HDFS に含まれるデータを視覚化するためのアプローチまたはガイドラインを探しています。

たとえば、HDFS の複数のファイルに格納された一連のデータ ポイントがあり、データのヒストグラムを表示したいとします。どのポイントがどのバケットに入るかを調べ、合計をファイルに書き込み、プロット ライブラリを使用してそれを視覚化するカスタム マップ/リデュース ジョブを作成する唯一のオプションはありますか?

カスタム ソリューションを展開する必要がありますか? または、このようなことを行っている人は他にいますか? インターネットで調べてみましたが、これに直接関係するものを見つけることができませんでした。

ご協力ありがとうございました

4

1 に答える 1

1

Datameer では、このようなことを行っています。ファイルをビジュアライゼーションに到達させるには、さらにいくつかの処理手順が必要になりますが、Hadoop でネイティブに実行されるため、ファイルが遠く離れることはありません。

于 2012-10-16T08:06:52.277 に答える