1

次のマシンにofed-1.5-3を新しくインストールしました:

SUSE Linux Enterprise Server 11 (x86_64) バージョン = 11 パッチレベル = 1

管理者がマシンに CX354A カード (MCX354A-FCBT) カードをインストールしました。$ lspci | grep -i mel 04:00.0 ネットワーク コントローラ: Mellanox Technologies Device 1003

(質問 1: lspci のこの出力が正しいかどうかはわかりませんが、正しいと思われますが、正しい出力を取得する方法がわかりません。)

./mlnxofedinstall スクリプトを使用して ofed パッケージをインストールした後:

ofed_info の出力 | ヘッド -1 : MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0):

インストールは成功し、openibd は必要なモジュール/ドライバーをすべてロードしました。$ サービス openibd ステータス

HCA ドライバーが読み込まれました

構成済み IPoIB デバイス: ib0 ib1

現在アクティブな IPoIB デバイス:

次の OFED モジュールがロードされます。

rdma_ucm ib_srp rdma_cm ib_addr ib_ipoib mlx4_core mlx4_ib mlx4_en ib_mthca ib_uverbs ib_umad ib_ucm ib_sa ib_cm ib_mad ib_core iw_cxgb3 iw_nes

hca_self_test.ofed の出力

---- アダプタ デバイスのセルフ テストを実行中 ---- 検出された CA の数 ................................ 1 PCI デバイス チェック .................. .... PASS カーネル アーチ ................................... x86_64 ホスト ドライバー バージョン .... ................ MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0): 2.6.32.12-0.7-default ホスト ドライバー RPM チェック .. ................ CA #0 VPI の PASS ファームウェア ................................ CA #0 の v2.10.700 ファームウェア チェック(VPI) .... 該当なし 理由: 必要なファームウェア バージョンはありません ホスト ドライバの初期化 ........... PASS アクティブな CA ポートの数 .......... ...... 0 ポート CA #0 のポート #1 の状態 (VPI) ..... DOWN (InfiniBand) CA #0 のポート #2 の状態 (VPI) ..... DOWN (InfiniBand) ) CA #0 (VPI) のエラー カウンター チェック...... PASS カーネル Syslog チェック ................................. CA #0 (VPI) の PASS ノード GUID ) ... 00:02:c9:03:00:f9:ed:e0 ------------------ 完了 ----------------------

質問 2: ibstatus または ibv_devinfo を試すと、ポートのステータスが PORT_DOWN と表示されます。私がドキュメントを読んでいる間、それはINIT状態でなければならないということです。私の質問は、これを INIT 状態にする方法です。$ ibv_devinfo

hca_id: mlx4_0 トランスポート: InfiniBand (0) fw_ver: 2.10.700 node_guid: 0002:c903:00f9:ede0 sys_image_guid: 0002:c903:00f9:ede3 vendor_id: 0x02c9 vendor_part_id: 4099 hw_ver: 0x0 board_id: MT_0 port_1090: MT_0 port_1901状態: PORT_DOWN (1) max_mtu: 2048 (4) active_mtu: 2048 (4) sm_lid: 0 port_lid: 0 port_lmc:0x00 link_layer: IB

            port:   2
                    state:                  PORT_DOWN (1)
                    max_mtu:                2048 (4)
                    active_mtu:             2048 (4)
                    sm_lid:                 0
                    port_lid:               0
                    port_lmc:               0x00
                    link_layer:             IB

次のコマンドを試したところ、エラーが発生しました:

$ ibportstate -G 0x0002c90300f9ede0 1 クエリ/有効化/無効化 ibwarn: [9318] mad_rpc_open_port: UMAD ポートを開けません ((null):0) ibportstate: iberror: 失敗しました: '(null)' ポート '0' を開けませんでした

質問 3: なぜこのエラーが発生したのか、またはどうすれば解決できるのかわかりませんでした。どんな助けでも大歓迎です。

さらに情報が必要な場合はお知らせください。

ありがとう

4

1 に答える 1

1

このノードを別のノードまたはインフィニバンド スイッチにインフィニバンド ケーブルで接続するまで、ibv_devinfo のポート ステータスはダウンになります。モジュールから、必要なものはすべてセットアップされているように見えますが、通信するノードがもう 1 つ欠けているだけです。別のノードに接続するとすぐに、状態が PORT_INIT に変更され、リンク速度などが設定されていることがわかるはずです。

于 2012-10-12T09:23:00.583 に答える