問題タブ [gfs]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
performance - Googleファイルシステムのスループットはどれくらいですか?
Googleファイルシステムのスループットはどれくらいですか?
linux - GFS と lvm を使用して、クラスター内のどこかでファイルが開いているかどうかを確認するにはどうすればよいですか?
ファイルが同じGFSクラスター内の別のノードによって既に開かれているかどうかを確認することは可能ですか? たとえば、fuser コマンドは TruCluster のクラスタ全体で実行されます。コマンドまたは API を介してロック マネージャーのデータを照会することは可能ですか?
computer-science - SSTableとは何ですか?
BigTable / GFSとCassandraの用語では、SSTableの定義は何ですか?
file-io - HadoopファイルシステムがランダムI/Oをサポートしないのはなぜですか?
GoogleファイルシステムやHadoopのような分散ファイルシステムは、ランダムI/Oをサポートしていません。
(以前に書き込んだファイルを変更することはできません。書き込みと追加のみが可能です。)
なぜ彼らはこのようなファイルシステムを設計したのですか?
デザインの重要な利点は何ですか?
PS私はHadoopが書き込まれたデータの変更をサポートすることを知っています。
しかし、彼らは、それはパフォーマンスが非常に良くないだろうと言いました。なんで?
hadoop - 複数のクライアントから並行して HDFS ファイルに追加することは可能ですか?
基本的に、質問全体がタイトルにあります。複数のコンピューターから同時に HDFS にあるファイルに追加できるかどうか疑問に思っていますか? 複数のプロセスによって常に生成されるイベントのストリームを保存するようなもの。順序は重要ではありません。
GFS がそのような追加機能をサポートしているという Google の技術プレゼンテーションの 1 つを聞いたことを思い出しますが、HDFS (通常のファイルの append() または SequenceFile を使用) でいくつかの限定的なテストを試みてもうまくいかないようです。
ありがとう、
filesystems - ファイルシステムのコンテキストでの原子性とは何ですか?
webopediaによると、プロセッサがバスの読み取りと書き込みの両方を行う場合です...他のプロセッサがバスにアクセスすることはできません。
ウィキペディアによると、データベースでは、一連の操作がすべて発生するか、まったく発生しないことを意味します。
並行プログラミングでは、システムウィキペディアに見られるように、一連の操作が瞬時に発生することを意味します。
ただし、ファイルシステム、特にGoogleファイルシステムのコンテキストで原子性が何を指しているのかを知る必要があります。
人々がbcを使用する使い古された単語のようですが、それはクールに聞こえます..しかし、ファイルシステムに関してより学術的な定義はありますか?
アトミックとは、何かを壊さないこと、つまりアトムを指しているようです...一般的な場合。Googleファイルシステムで使用されているアトミック読み取りとアトミック書き込みという用語をよく耳にします。
私の推測では、それは完全に起こるか、まったく起こらないか、1つの「ステップ」で起こることを意味します。時間の統一(瞬間的に見える)と構成(すべての部分が完成している)を指します。
この音は正しいですか?
gtk - Gnome-Shell-Extension 開発における永続的なロギング?
私はJavascriptベースのバインディングを試して、webkitviewを埋め込むだけの独自のGnome-Shell-Extensionを構築しています。
しかし、次の 3 行で gnome-shell を完全にクラッシュさせます (上部パネルが消え、再起動するには再ログインする必要があります)。したがって、LookingGlass の「エラー」タブを調べて、何が間違っていたのかを調べる方法はありません。
何が問題なのかを知る方法はありますか?
architecture - ランダム書き込み操作に関する「追加操作」の例は何ですか?
Google ファイル システム (GFS) の論文を読み終えたところです。この論文によると、GFSは
この特徴が論文全体で強調されているのを見ると、非常に重要であるに違いないと思います。
まったく就労経験のない学生として、Appending Operations
Google が語るそのような実生活の例は何ですか? かなり強烈に聞こえます。
hadoop - Flume の HDFS シンクは、デフォルトの設定で「アンチパターン」を使用していますか?
Apache Flume の HDFS シンクのデフォルト パラメータを見ると、大量の非常に小さなファイル (1 kB ロール) が生成されるようです。私が GFS/HDFS について学んだことから、ブロックサイズは 64MB であり、ファイルサイズは、すべてが効率的に実行されることを確認するためにむしろギガバイトである必要があるということです。
したがって、Flume のデフォルト パラメータが単に誤解を招くだけなのか、それともここで何か見落としているのか、気になります。
乾杯。
distributed-system - Google ファイル システムの一貫性モデルに関する問題
記事The Google File Systemを読んだ後、私はまだいくつかの点で混乱しています:
「追加操作」と「書き込み操作」の利点は何ですか?この記事では、書き込み操作ではなく追加操作を使用することを強調しています。
チャンクの冗長性間の一貫性を維持するために、gfs はリースを使用してチャンクサーバーをプライマリとして使用し、一貫性を実現するためにプライマリに操作シーケンスを決定させます。再試行した後、更新操作がまだ成功しない場合、冗長性が問題になります。その後、異なるクライアントが更新された同じオフセットで同じチャンクを読み取るようになると、それらは異なるコンテンツを読み取る可能性があります.gfs はこの種の問題にどのように対処しますか.
追加操作でエラーが発生した場合、プライマリ チャンクサーバーは新しいオフセットを選択してレコードを追加しますか? レコードとはどういう意味ですか?クライアントがファイルを読み取るとき、ファイル内のパディングまたは重複レコードをどのように処理できますか?