分散 Hadoop クラスターで、同じ hdfs-site.xml ファイルを namenodes と datanodes にコピーできますか?
私が見たいくつかのセットアップ手順 (Cloudera など) では、データノードのこのファイルに dfs.data.dir プロパティがあり、namenode のこのファイルに dfs.name.dir プロパティがあると書かれています。つまり、namenode 用と datanode 用に 1 つずつ、hdfs-site.xml の 2 つのコピーが必要です。
しかし、それがすべて同じである場合は、ファイルのコピーを 1 つ所有/維持し、変更するたびにすべてのノードにプッシュします。同じファイルに dfs.name.dir と dfs.data.dir の両方のプロパティを含めることに害やリスクはありますか? データ ノードが "dfs.name.dir" のプロパティを認識した場合、どのような問題が発生する可能性がありますか? また、問題がある場合、namenode の hdfs-site.xml ファイルには、datanode ではなく、他にどのようなプロパティを含める必要がありますか? およびその逆。
最後に、クライアント マシン (タスク トラッカーやデータノードではなく、Hadoop クラスターと通信するだけのマシン) にコピーする hdfs-site.xml ファイルに含める必要があるプロパティは何ですか?
O'reilly のオペレーション ブックなどを検索しましたが、ノードごとに構成ファイルをどのように変更する必要があるかを説明している適切な記事が見つかりません。ありがとう!