Hadoop を実行しており、クラスター内に同じ構成のサーバーが 2 台あります。それらは同じタスク、同じ構成、同じすべてを実行しており、どちらも Hadoop タスク ノード (ワーカー) として完全に専用です。
このクラスターで実行しているジョブは、IO バウンドが高いです。
あるサーバーでは of と of が表示60-100MB/secさIOれCPU load、5-10もう一方のサーバーでは40-60MB/secofIOと aが表示されCPU load of 60-90ます (単純なシェルを実行するという点でも、ボックスはほとんど使用できません)。
実行しましたがsmartctl、ディスクの警告は表示されません。

これらのボックスの根本的な違いを特定するために次に何をするかについて何か提案はありますか? これらの結果は、何時間もの処理で一貫しています。