32 ノードのクラスターで実行されている UPC-NAS ベンチマーク (256 スレッド用にコンパイル) を取得しようとしています。実行すると、247 スレッドの rsh 接続が確立され、次のようなエラーが発生して終了します。
p0_11350: p4_error: Child process exited while making connection to remote process on dell16: 0
506 rm_l_237_24446: (26.785156) net_send: corm_11947: (215.339844) net_srm_l_1rm_24412: (26.785156) net_send: could not write to fd=4, errnrrrm_l_127_5013: (121.984375) net_send: could not w rite to fd=5, errno = 32
問題がどこにあるのか誰でも指摘できますか?
64、128などのより少ないスレッドでは問題なく動作します。