エラーは次のとおりです。
2015-12-11 04:01:47,306 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: anmol-vm1-new:50010:DataXceiver error processing WRITE_BLOCK operation src: /10.0.1.193:57002 dst: /10.0.1.190:50010
org.apache.hadoop.net.ConnectTimeoutException: 65000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/10.0.1.192:50010]
at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:532)
at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:493)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:650)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.opWriteBlock(Receiver.java:124)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.processOp(Receiver.java:71)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:232)
at java.lang.Thread.run(Thread.java:745)
http://pastebin.com/bP6W7P7y DataNode ログ (エラーを含む)
現在表示されているノードの 2 つのスクリーンショットと、現在表示されている gridmix-generate.sh から現在表示されているもののスクリーンショットを添付しました。
http://pastebin.com/jd12yDEk gridmix-generate ランタイム ログ
yarn-site.xml には、yarn.execution.optimistic-containers-policy only_conservative があります。
すべての VM でまったく同じ conf フォルダがあります。dstat をインストールしました。
現在、ノードはまだダウンしていませんが、実行中のどこかでノードがダウンして欠落しているため、何が間違っているのか、何が欠けているのか考えてみてください。
最後に、私たちの糸アプリケーションのステータスを示します: http://pastebin.com/WiMa0yRf