Hadoop がこれらの新しいクラスを導入する必要があるのはなぜですか? それらはインターフェースを複雑にしているようです
質問する
28111 次
4 に答える
2
Apacheのドキュメントページから:
Writable
インターフェイスは次のように記述されます
とに基づく、単純で効率的なシリアライゼーション プロトコルを実装するシリアライズ可能なオブジェクト。
DataInput
DataOutput
この新しい API を使用すると、面倒なことはありません。これらの新しいクラスを使用したシリアル化プロセスはcrisp
とcompact
です。
クラスター内のノード間で膨大な数のリモート呼び出しが発生するため、Hadoop の効果を得るには、シリアライゼーション/デシリアライゼーション プロセスを最適化する必要があります。したがって、シリアライゼーション形式は、高速、コンパクト、拡張可能、相互運用可能である必要があります。この理由により、Hadoop フレームワークは、Java プリミティブ データ型を置き換える 1 つの IO クラスを考え出しました。たとえばIntWritbale
、 for int
、LongWritable
for long
、Text
forString
など。
このトピックの詳細については、Hadoop The definitive guide : 4th Editionを参照してください。
于 2016-05-16T10:05:17.217 に答える