1

HDFS Archiectiure guideのSimple Coherency Modelセクションの下に、次のように記載されています(強調は私のものです):

HDFS アプリケーションには、ファイルに対する write-once-read-many アクセス モデルが必要です。一度作成、書き込み、閉じたファイルは変更する必要はありません。この前提により、データの一貫性の問題が単純化され、高スループットのデータ アクセスが可能になります。Map/Reduce アプリケーションまたは Web クローラー アプリケーションは、このモデルに完全に適合します。将来、ファイルへの追加書き込みをサポートする計画があります。

ここでの「不要」の使用に混乱しています。それらは本当に「してはならない」または「してはならない」という意味ですか? もしそうなら、HBase のようなプログラムはどのように更新サポートを提供できますか? それらが本当に「必要ない」(つまり、「必要ない」) という意味である場合何を伝えようとしているのでしょうか。一度書き込んだファイルを変更する必要があるファイル システムはどれですか?

4

1 に答える 1

1

私が知る限り、これは「データの一貫性の問題を単純化して高...」という前提need notの一部です。実際には を意味します。ただし、穴ファイルを削除して再度作成することはできます。can't

hadoop 0.20.2-append (ここに示すように) の後、データを追加できます。

私が読んだ限りでは、HBase は主にメモリ ( WAL? セクション 11.8.3 ) を使用し、変更はマークとして追加されることを理解しています。たとえば、列を削除するには、削除をマークするだけのトゥームストーン(セクション 5.8.1.5参照) と定期的な圧縮を行います。

多分私は間違っています。正確な説明を学ぶ良い瞬間です:)

于 2013-05-10T22:36:53.043 に答える