2

以下のサンプル問題の答えを確認したい

質問1

hadoop fs -put コマンドを使用して、sales.txt を HDFS に追加します。このファイルは、クラスター内の 3 つのノードにレプリケートされる単一のブロックに収まるほど小さいです。これらのノードの 1 つに障害が発生した後、クラスターはいつ、どのようにレプリケーションを処理しますか?

A. ク​​ラスターは、このブロックの再複製を試みません。
B. このブロックはすぐに再複製され、進行中はクラスター上の他のすべての HDFS 操作が停止します。
C. 管理者がファイルを手動で削除して再作成するまで、ブロックは十分に複製されないままになります。
D. NameNode が、DataNode から受信したブロック レポートに基づいて複製不足であると判断した後、ファイルは自動的に再複製されます。

答えはDだと思います

質問2

いくつかの手順を実行する複雑な計算を実行するには、コードを記述する必要があります。これらのジョブを連鎖させ、中間計算の結果を格納するキーのカスタム複合クラスを開発することにしました。このキーはどのインターフェースを実装する必要がありますか?

A. 書き込み可能
B. 転送可能
C. CompositeSortable
D. WritableComparable

答えはDだと思います

質問 3

キーに年を使用するアプリケーションを開発しています。年を表すキーに最も適した Hadoop 提供のデータ型はどれですか?

A. テキスト
B. IntWritable
C. NullWritable
D. BytesWritable
E. どれも適切ではありません。カスタムキーを実装する必要があります。

答えはBだと思います

4

3 に答える 3

7

1 - 正解です。これは、HDFS のフォールト トレランスについて説明している文献に記載されています。Hadoop: The Definitive Guide の第 3 章には、クライアントがデータを HDFS に書き込むプロセスと、この失敗のプロセスがどのように機能するかを説明するセクションがあります。

2 - 正解です。配列やその他の比較不可能な型を含む可能性がある他のカテゴリに分類されないように、キーは書き込み可能である必要があります。

3 - 正解です。年は数値であるため、これらすべての中で最も適切なオプションは書き込み可能です。

于 2013-04-11T01:50:11.620 に答える
0

Q 1 & 2 の回答は D が正解ですが、Q 3 は D だと思います。間違っている可能性があります。

于 2013-04-11T01:56:32.550 に答える
0

Q3は非常にトリッキーかもしれませんが、おそらくB.

使用するのに最適なものはShortWritable、 から の範囲の 2 バイトを必要とするためです-32000 ~ +32000。したがってBytesWritable、2バイトのみを使用して割り当てることができます。は から の範囲のIntWritable4 バイトを使用しますが-2 billion to +2 billion、これは余分な 2 バイトの無駄です。

を使ってもTextと同じバイトサイズ(4文字なので4バイト)IntWritableです。ただし、Intキーを使用して関連する操作を行っている場合は、そのIntWritableほうがよいと思います。

答えが B だと思う唯一の理由は、多くの Java 開発者が数値範囲に関係なく常に Int を使用し、Short代わりに使用することはめったにないからです。したがって、この質問は「依存」です。キーに対して整数関連の操作を行っていない場合は を使用しBytes、それ以外の場合はIntWritable を使用します。もし私が答えを選ばなければならないなら、B.

于 2013-09-17T21:28:29.963 に答える