私が読んだことから、HDFSはいくつかのPOSIX技術を緩和するので高速ですが、これはどのように機能しますか?または少なくともどれですか?グーグルで、誰かがアスカーを大きなサイトにリダイレクトしているのを見つけたので、私は答えを見つけられませんでした!
1 に答える
Hadoopによると-決定的なガイド(本を入手することをお勧めします)
ファイルを作成すると、予想どおり、ファイルシステムの名前空間に表示されます。
ファイルシステムのコヒーレンシモデルは、ファイルの読み取りと書き込みのデータの可視性を記述します。HDFSは、パフォーマンスに関するPOSIX要件の一部をトレードオフするため、一部の操作は、予想とは異なる動作をする可能性があります。
ただし、ストリームがフラッシュされた場合でも、ファイルに書き込まれたコンテンツが表示される保証はありません。したがって、ファイルの長さはゼロのように見えます。
ブロックに相当するデータが書き込まれると、最初のブロックが新しいリーダーに表示されます。これは後続のブロックにも当てはまります。他のリーダーに表示されないのは、常に現在書き込まれているブロックです。
HDFSは、FSDataOutputStreamのsync()メソッドを介して、すべてのバッファーをデータノードに強制的に同期させるためのメソッドを提供します。sync()から正常に戻った後、HDFSは、ファイル内のその時点までに書き込まれたデータが保持され、すべての新しいリーダーに表示されることを保証します。
もう一つは
権限には、読み取り権限(r)、書き込み権限(w)、実行権限(x)の3種類があります。ファイルの読み取りまたはディレクトリの内容の一覧表示には、読み取り権限が必要です。ファイルを書き込む場合、またはディレクトリを作成または削除するには、書き込み権限が必要です。(POSIXとは異なり)HDFSでファイルを実行できないため、ファイルの実行権限は無視されます。ディレクトリの場合は、その子にアクセスする必要があります。