問題タブ [mali]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
22 参照

arm - マリ ミッドガード GPU の内積単位

こんにちは、mali t-624 GPU (Midgard Family GPU) を使用しています。これらの GPU がドット積をサポートしているかどうかを教えてください。これに関する情報が見つかりません。また、opencl で記述されたカーネルを教えていただけますか。これにより、内積の最適な実行時間が得られます。

0 投票する
0 に答える
66 参照

matrix - Mali の GPU で行 x 行が行 x 列よりも 4 ~ 5 倍遅いのはなぜですか?

最近、コンピュータ シェーダを使用して行列乗算を開発しているときに問題が発生しました。一般的な行列の乗算 C = AB. 記憶を連続的にするために、B行列を転置しました。これで走行速度が上がると思います。しかし、速度を測ってみると、X線の方がX線より数倍遅い形​​でした。 !

  • 私の環境 Mali G77 (MediaTek Dimensity 1200)
  • マトリクス寸法:4x2048x2048
  • B マトリックス次元: 4x2048x2048

時間比較:

  • 行×行:約9秒
  • 行×列:約1.6秒
  • コラム×コラム:約3.3秒

質問のデモ: https://github.com/yikox/ProfilerDemo

シェーダ コード:

0 投票する
0 に答える
27 参照

arm - Arm Mali T-624 GPU 算術パイプライン深度カーネル

Arm Mali T-624 ボードで調査を行っています。gpu 演算パイプラインのステージ数を知りたくて、次のカーネルを実行しています。

そして、このカーネルを 1 から 512 のワークグループで実行していますが、ワークアイテムの数を 1 に安定させて います ここに画像の説明を入力してください

したがって、この有効期限の結果は、算術パイプラインの長さが約 38 ステージになるということです。

それは正しいと思いますか。