問題タブ [mellanox]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
infiniband - SA クエリ Infiniband の問題
ib_saから関数 ib_sa_path_rec_get に渡されるパラメーターコンテキストは何ですか?
linux - CentOS 6.6 でモジュールをロードする際の「無効なモジュール形式」エラー
同じハードウェア (Infiniband と Nvidia Tesla) と同じ OS (CentOS6.6、カーネルとドライバー) を備えた 2 台のツイン サーバーがあります。
host1 ではすべて正常に動作していますが、host2 では次のエラーが発生するため、このサービスを実行できません。
そしてdmesgは言う:
host2 は、夏休みの後に再起動するまで、2 か月間正常に動作していたことに注意してください。:-( このエラーの原因は何でしょうか? 主要なソフトウェア コンポーネント (カーネル、Nvidia ドライバー、Mellanox ドライバー) は変更されておらず、ハードウェアは問題ありません。インストール手順を繰り返してみましたが、モジュールの読み込みでスタックします。点:
同じシンボルをエクスポートする 2 つのカーネル モジュールに関するこの投稿を見つけましたが、なぜ host2 ではこの 2 番目のモジュールが nv_peer_mem を妨げているのに、host1 ではそうではないのでしょうか? これは nm コマンドの出力で、両方のホストでまったく同じです。
助けてくれてありがとう。ステ。
infiniband - Verb メモリ ウィンドウ (ibv_alloc_mw) の使用中にエラーが発生しました
メモリ ウィンドウを使用しようとしていますが、 ibv_alloc_mwを呼び出すと(両方のタイプの MW で) EPERM (errno=1) が発生します。
Mellanox ConnectX-3 カードと次の OFED があります。
私のカードはこの機能をサポートする必要があるようです:
Mellanox OFEDで rping を実行すると、同じエラーが発生します。
ibv_alloc_mw は Mellanox でもサポートされていますか?
編集:
ConnectX-4 カードにアクセスしましたが、同じエラーが発生しました。また、メモリ ウィンドウ オプションを指定してrpingを実行しようとすると、エラーがログに記録されることもわかります。
infiniband - ibv_exp_post_send および ibv_exp_post_task のコンテキストにおけるプロデューサー インデックス (PI) とは何ですか?
RDMA Aware Programming User Manualの付録 D に記載されている Cross-Channel Communication サポートを使用しようとしています。残念ながら、特定の関数の引数の意味について少し混乱しています。
私の質問
ibv_exp_post_send()
および関数はibv_exp_post_task()
、それぞれ作業リクエスト構造体のリンクされたリストと作業リクエスト構造体のコレクション*を取ります。その構造体の cq_count と wqe_count の意味は何ですか?
最初の作業リクエスト/完了の番号は常に 1 で、後続の作業リクエスト/完了は直線的に増加していますか? それとも、ibv_exp_post_task() 呼び出しの間や、いくつかのリクエストが処理された後に減少するなど、時々リセットされますか? 数値は ibv_exp_post_send または ibv_exp_post_task の間で一致していますか?
*技術的には、作業要求のリンクされたリストを含むタスクのリンクされたリストへのポインタ。