0

Mapper によって 10 フィールド前後に書き出されるフィールドがたくさんあります。1. フィールドを次のように書き出します。

    tradeDate.readFields(in);
    marketMakerId.readFields(in);
    eventTime.readFields(in);
    bidPrice.readFields(in);
    ......................... 

または 2. それらを単一のテキスト フィールド (tradeDate、marketId、evenTime、bidPrice....) に変換し、Reducer でオブジェクトを再構築します。

これらのうち、どの方法でパフォーマンスを向上させることができますか?

4

1 に答える 1

1

いつものように、ベンチマークが役立ちます。Caliperを使用して仮説を確認できます。

ただし、一般に、テキスト <-> バイナリ変換が含まれる場合、バイナリ形式の方が高速です。したがって、バイナリの read/writeFields はより高速に動作すると思います。

于 2012-10-11T20:01:58.493 に答える