Windows XP ベースの単純なクラスターを構築しようとしています。OpenMPI-1.4.2 を正常にコンパイルし、ツールも同様mpicc
にompi_info
動作しますが、適切に動作させることができませんmpirun
。私が見ることができる唯一の出力は
Z:\>orterun --hostfile z:\hosts.txt -np 2 ホスト名 [host0:04728] COM ライブラリの初期化に失敗しました。エラー コード = -2147417850 [host0:04728] [[8946,0],0] ORTE_ERROR_LOG: ファイル ..\..\openmpi-1.4.2 でエラーが発生しました \orte\mca\ess\hnp\ess_hnp_module.c 行 218 -------------------------------------------------- ------------------------ orte_init が何らかの理由で失敗したようです。あなたの並列プロセスは 中絶する可能性があります。並列プロセスが可能になる理由はたくさんあります。 orte_init 中に失敗しました。そのうちのいくつかは構成または 環境問題。このエラーは内部エラーのようです。 ここにいくつかの追加情報があります (これは、 MPI 開発者を開く): orte_plm_init に失敗しました --> ORTE_SUCCESS の代わりにエラー (-1) が返される -------------------------------------------------- ------------------------ [host0:04728] [[8946,0],0] ORTE_ERROR_LOG: ファイル ..\..\openmpi-1.4.2 でエラーが発生しました \orte\runtime\orte_init.c 132 行目 -------------------------------------------------- ------------------------ orte_init が何らかの理由で失敗したようです。あなたの並列プロセスは 中絶する可能性があります。並列プロセスが可能になる理由はたくさんあります。 orte_init 中に失敗しました。そのうちのいくつかは構成または 環境問題。このエラーは内部エラーのようです。 ここにいくつかの追加情報があります (これは、 MPI 開発者を開く): orte_ess_set_name が失敗しました --> ORTE_SUCCESS の代わりにエラー (-1) が返される -------------------------------------------------- ------------------------ [host0:04728] [[8946,0],0] ORTE_ERROR_LOG: ファイルのエラー..\..\..\..\openmpi -1.4.2\orte\tools\orterun\orterun.c 543行目
次z:\hosts.txt
のように表示されます。
ホスト0 ホスト1
Z:
host0 と host1 の両方で使用できる共有ネットワーク ドライブです。
私の問題は何ですか?どうすれば解決できますか?
Upd: OK、この問題は修正されたようです。WideCap ドライバーやソフトウェア コンポーネントが原因でこのエラーが表示されるようです。「クリーン」なマシンは、ローカル タスクを正常に実行します。とにかく、少なくとも 2 台のマシン内でまだタスクを実行できません。次のメッセージが表示されます。
Z:\>mpirun --hostfile z:\hosts.txt -np 2 ホスト名 host1 に接続中 ユーザー名:MAIN\cluster パスワード:******** 資格情報を保存しますか?(Y/N) y [host0:04728] この機能はまだ実装されていません。 [host0:04728] ノード host1 のネームスペース cimv2 に接続できませんでした。エラー コード =-2147217400 -------------------------------------------------- ------------------------ エラーが発生したため、mpirun は指定されたアプリケーションを開始できませんでした。 詳細については、上記を参照してください。 -------------------------------------------------- ------------------------
http://www.open-mpi.org/community/lists/users/2010/03/12355.phpで説明されているように、少しグーグルで検索し、すべてのことを行いましたが、それでも同じエラーが発生します。誰でも私を助けることができますか?
Upd2:
エラー コード -2147217400 はWBEM_E_INVALID_PARAMETER (0x80041008)
、WMI 呼び出しに渡されたパラメーターの 1 つが正しくない場合に発生する WMI エラーである可能性があります。これは、問題が OpenMPI ソース コード自体にあるということですか? それとも、ソース コードから OpenMPI をビルドする際に使用しwincred.h
た間違った/古いものが原因でしょうか?credui.lib