MPI がどのように実装されているかを知る最良の方法は何ですか? MPI を高速化するために、ハードウェアにはどのようなサポートがありますか? NIC が提供する機能とは具体的にどのようなものですか? MPI の実装は SHMEM の実装とどう違うのですか?
また、すべての実装がプロセス (共有メモリ、メッセージ キュー、NIC、kaput など) 間でデータを転送する方法についても混乱しています。
このトピックに関する本を探しましたが、MPI の「使用」方法または MPI アルゴリズムに関する本しか見つかりませんでした。
オープン ソース実装の 1 つのソース コードに飛び込む必要がありますか?