0

Hadoop と Hadoop ストリーミングの InputFormats に違いがあるのだろうか。Hadoop ストリーミングの入力形式は Hadoop でも機能しますか? その逆も同様ですか? ウィキペディアのダンプ ファイル用の特別な入力形式である wikihadoop InputFormat を見つけたので、これを尋ねています。そして、hadoop ストリーミング用の入力フォーマットと書かれていますか? なぜ Hadoop ストリーミング専用なのですか? Hadoop 用ではありませんか?

ベスト

4

3 に答える 3

0

通常の入力フォーマットと、Hadoop ストリーミング用に開発されたものに違いはありません。

著者がこの形式は Hadoop ストリーミング用に開発されたものであると述べたとき、彼女が意味した唯一のことは、彼女の入力形式が意味のある toString メソッドを持つオブジェクトを生成するということでした。それでおしまい。

たとえば、Hadoop ストリーミングで使用する入力形式を開発するときは、BinaryWritable を避け、代わりに Text を使用するようにしています。

于 2016-01-18T14:49:19.230 に答える