3

活発な実装によると[CassandraSFでのプレゼンテーション]-Cassandra、CFS、Job / Task Tracker、およびHive Metastoreは、独立したHadoopクラスターの構成とはまったく異なる単一のJVMで実行されます。

これは利点ですか?

Task TrackerまたはJVM内の個々のプロセスのいずれかが失敗した場合はどうなりますか?同じJVM内のcassandraインスタンスに影響しますか?

CFSはどのようにしてデータを取得しますか?SSTableをサブブロックとして保存していますか、それともそのコピーとして保存していますか?サブブロックの圧縮はどこで行われますか?

よろしく、タミル語

4

1 に答える 1

3

Briskは、すべてを単一のJVMで実行しますが、相互に影響を及ぼさない個別の独立したスレッドで実行します。トラッカーは専用ノードで実行されますが、単一障害点はありません。トラッカーを実行するために任意のノードを選択でき、すべての状態がCassandraクラスターに保持されます。

すべてが同じJVMにあることの利点は、CassandraからHadoopコードにデータを移動するためのコピーとシリアル化のオーバーヘッドがないことです。

CassandraFSは、64MBのHDFSブロックを2MBのチャンクに分割し、ブロックごとに1行ずつ、Cassandraの列として格納します。ファイル自体は、iノード列ファミリーのブロック行UUIDのリストにマップされます。

于 2011-11-03T23:54:26.603 に答える