1

まず最初に、ここでこの質問をするのが適切な場所かどうかはわかりませんが、私たちだと思いますが...別のstackexchangeサイトの方が適している場合はお知らせください。

3 か月前、私は 6 台のコンピューター (Suse Linux 9.2) で気象モデルを予測モードで実行しているクラスターを担当しています。最近、電源の切断により、ノードの 1 つがクラッシュしました。Lubuntu 12.04 をインストールした後 (Suse 9.2 ディスクは使用できず、10.2 のみ)、このコンピューターをクラスターに再接続しようとしました。

  • インストールされたopensshサーバー
  • パスワードを要求せずに ssh-keygen を実行して ssh に接続する
  • インストールされた NFS サポート
  • /etc/fstab を編集
  • 編集した /etc/hosts

次に、met モデルを実行しようとしましたが、次のエラー メッセージが表示されました。

rm_1993: p4_error: Could not gethostbyname for host thalassa; may be invalid name : 61
p0_12316: p4_error: Child process exited while making connection to remote process on thalassa3: 0

Google で検索した後、/etc/resolv.conf に関するいくつかの問題を見つけ、このファイルを編集しました。

ドメインceam.es dns-nameservers 192.168.1.1 nameserver 127.0.0.1

ただし、エラー メッセージは引き続き表示されます。私は何かが欠けていると思います。私は専門のシステム管理者ではありませんが、対処する必要があります。

ここで、エラー ログホスト、およびresolv.confを見つけることができます。

ヘルプやアイデアは大歓迎です。ネットで解決策を探し続けます。

前もって感謝します

4

1 に答える 1

1

これらのメッセージは、元の MPICH ソフトウェア (MPICH1 と呼ばれることが多い) を実行していることを示しています。システムを機能させるためにパッチを元に戻すことはできるかもしれませんが、長い間サポートされていないこのようなソフトウェアを実行するべきではありません。

最新の MPICH (以前は MPICH2 と呼ばれていました) v3.0.1 以降にアップグレードすることをお勧めします。インストールと構成はかなり簡単ですが、実行している古いアプリケーション コードでは、最新の MPICH に含まれる追加のエラー チェックが適切でない可能性があります。

http://www.mpich.org/

于 2013-01-30T23:50:18.430 に答える