PTX を勉強していますが、CTA (計算スレッド配列) と CUDA ブロックの違いがわかりません。
それらは同じものですか?今のところ (私は PTX ドキュメントの冒頭にいるだけです)、それらはまったく同じであるように思えます
はい、PTX 協調スレッド配列は、概念的にも機能的にも、CUDA のブロックまたは OpenCL のワークグループと同じです。
CUDA PTX ISA ドキュメントのスレッド階層セクションでは、基本的にCTA は CUDA ブロックを意味すると説明されています。
また、実際には「計算スレッド配列」ではなく、「協調スレッド配列」(!) であることに注意してください。
CTA は別の言い方をすれば、Threadblock Nvidia は CTA と呼んでいます。