0

デバッグ用に centos 6.2.64 マシンでサンプルの Hadoop ジョブを実行しています。

hadoop jar hadoop-examples-0.20.2-cdh3u3.jar randomtextwriter o

ジョブが完了した後も、データノードへの接続は残っているようです。

java       8979 username   51u     IPv6          326596025        0t0       TCP localhost:50010->localhost:56126 (ESTABLISHED)
java       8979 username   54u     IPv6          326621990        0t0       TCP localhost:50010->localhost:56394 (ESTABLISHED)
java       8979 username   59u     IPv6          326578719        0t0       TCP *:50010 (LISTEN)
java       8979 username   75u     IPv6          326596390        0t0       TCP localhost:50010->localhost:56131 (ESTABLISHED)
java       8979 username   84u     IPv6          326621621        0t0       TCP localhost:50010->localhost:56388 (ESTABLISHED)
java       8979 username   85u     IPv6          326622171        0t0       TCP localhost:50010->localhost:56395 (ESTABLISHED)
java       9276 username   77u     IPv6          326621714        0t0       TCP localhost:56388->localhost:50010 (ESTABLISHED)
java       9276 username   78u     IPv6          326596118        0t0       TCP localhost:56126->localhost:50010 (ESTABLISHED)
java       9408 username   75u     IPv6          326596482        0t0       TCP localhost:56131->localhost:50010 (ESTABLISHED)
java       9408 username   76u     IPv6          326622170        0t0       TCP localhost:56394->localhost:50010 (ESTABLISHED)
java       9408 username   77u     IPv6          326622930        0t0       TCP localhost:56395->localhost:50010 (ESTABLISHED)

最終的に、しばらくするとデータノード ログにこのエラーが表示されます。

2012-04-12 15:56:29,151 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: DatanodeRegistration(127.0.0.1:50010, storageID=DS-591618896-176.9.25.36-50010-1333654003291, infoPort=50075, ipcPort=50020):DataXceiver
java.io.FileNotFoundException: /tmp/hadoop-serendio/dfs/data/current/subdir4/blk_-4401902756916730461_31251.meta (Too many open files)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(FileInputStream.java:137)
        at org.apache.hadoop.hdfs.server.datanode.FSDataset.getMetaDataInputStream(FSDataset.java:996)
        at org.apache.hadoop.hdfs.server.datanode.BlockSender.<init>(BlockSender.java:125)
        at org.apache.hadoop.hdfs.server.datanode.DataXceiver.readBlock(DataXceiver.java:258)
        at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:163)

これにより、本番システムで問題が発生します。つまり、データノードで xciever が不足します。この動作は、私の Ubuntu 開発ボックスでは発生しないようです。この目的のために、cloudera hadoop-0.20.2-cdh3u3 を使用しています。

この問題を解決するための指針はありますか?

4

1 に答える 1

1

まだ指定していない場合は、hdfs-site.xml に追加します。

<property>
<name>dfs.datanode.max.xcievers</name>
<value>4096</value>
</property>

デフォルトは256だと思います....

これは、そのようなエラーを回避するために必要な xciever の量の公式タイプの計算です...

 # of xcievers = (( # of storfiles + # of regions * 4 + # of regioServer * 2 ) / # of datanodes)+reserves(20%)
于 2012-04-10T12:56:11.447 に答える