7

複雑なmap-reduceジョブを実行するためのワークフローツールを探しています。私はOozieを念頭に置いていますが、カスケードについても調べたいと思っています。カスケードAPIを使用して既存のM/Rジョブをチェーンするサンプルコードまたは例はありますか?また、OozieとCascadingの比較を教えてください。

4

2 に答える 2

0

個人的に私はある程度両方をいじっていますが、カスケードで興味深いと思ったのは

1) フロー、タップ、パイプなどの単純なキーワードに関して簡潔で表現力豊かである、

2) ローカル開発と研究のための驚くべきTDDベースのアプローチ

3) 見やすいプランナー ビュー (.dot ファイル) は、プロジェクトが大きくなったときに役立つため、メンテナンスが容易です。

4) groovy、scala、cloujre を使用した DSL ベースのアプローチ。そのため、新しい言語や Hadoop の学習について心配する必要はありません。

5) シンプルなクラウド展開 (生の jar 展開としての amazon サポートなど)。

6) Java API を公開している限り、既存の pig や hive、または他の純粋な MR jar のようなものを呼び出すことができます。

7) ML および NLP 関連の作品には素晴らしい。

于 2013-10-31T07:35:50.420 に答える