問題タブ [amd-processor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - AMDOpenCLコンパイラはカーネル属性「work_group_size_hint」を無視します
私は現在OpenCLカーネルを最適化しており、ワークグループのサイズとベクトルの幅に最適な値を見つけようとしています。
現在、Intel i7-3930k(6コア@ 3.5 GHz、HT無効)とAMDHD6870を備えたubuntuシステムを使用しています。比較を可能にするために、IntelとAMDの両方のOpenCL実装がインストールされています。(AMD APP SDK v2.7 Linux64bおよびCatalyst12.4、Intel OpenCL SDK 1.5)。
CPU(Intelプラットフォーム上)で実行している私はそれを見つけました:
- 256のwgサイズを選択することにより、wgsize = 1と比較して約13.5%のパフォーマンスを得ることができます。
- 指定する
__attribute__((vec_type_hint(float4)))
ことで、30%のブーストを得ることができます。 - 指定する
__attribute__((work_group_size_hint(WG_SIZE, 1, 1)))
ことで、さらに約90%(!)
したがって、これらのオプションを合計すると、パフォーマンスが3倍近く向上する可能性があります。残念ながら、AMD OpenCLプラットフォームを使用してCPUでこのケースを実行すると、オプションの属性が無視されることがわかりました。
カーネル宣言は次のとおりです。
コンパイラの出力は次のとおりです。
AMDが常にこれらのヒントを無視するかどうか誰かが知っていますか?または、AMDプラットフォームでこれらの属性を有効にするために私がしなければならないことがありますか?
opengl - AMD ハードウェア上の基本的なスポットライト GLSL フラグメント プログラム
私は、いくつかのライトを描画する GLSL フラグメント プログラムを作成しました。一部はスポットライト エフェクト付きです (つまり、GL_SPOT_DIRECTION を指定した glLightfv と GL_SPOT_EXPONENT を指定した glLightf)。プログラムからの関連する抜粋は次のとおりです。
すべての変数は、(gl_ModelViewMatrix*gl_Vertex).xyz に設定されている頂点シェーダーからのさまざまな vec3 である「vec_vertex_eye_i」を除いて、自明であるか文書化されています。
このプログラムは、NVIDIA ハードウェア (NVIDIA GeForce 8400M GS および NVIDIA GeForce GTX 580M でテスト済み) では完全に動作しますが、AMD カード (具体的には ATI Mobility Radeon HD 4250) では誤った結果をもたらします。
私の質問は、glEnable やその他の必要な特別な構成の方法で不足している可能性があるものがあるかどうかです。AMD カードには新しいドライバーがあり、スポットライトはかなり重要な機能であり、壊れる可能性は低いと思います。シェーダーは正常にコンパイルされます。ここで何が欠けていますか?
opencl - AMD / ATI Radeon 6000シリーズGPUアーキテクチャとは何ですか?
質問を参照してください。5000シリーズと7000シリーズのドキュメントはありますが、6000シリーズの実際のメモはありません。これは、OpenCLで理論上の最大スループットに近づこうとする場合に役立ちます。
これまでのところ、AMDのプログラミングガイド(pdf)を見つけました。これは5000および7000シリーズをカバーします。しかし、それは通過する6000シリーズについてのみ言及しています。
opencl - OpenCLAMDAPPドライバーはLinuxサーバーでGPUを検出できません
私はAMDA8-3870APUをRadeon(tm)HDグラフィックスとUbuntu3.0.0-12-serverで使用しています。
x86_64用のamd-driver12-6をインストールします。
ただし、clinfoを実行すると、GPUデバイスを検出できません。代わりに、CPU情報を返します。
APUを使用しているのですか、それともamd-driverとLinuxサーバーに問題がありますか?
ありがとう〜
performance - AMD Opteron 6172 での PAPI パフォーマンス カウンターの問題
Red Hat Enterprise Linux Workstation リリース 6.2 (Santiago) を実行している AMD Opteron 6172 プロセッサのパフォーマンス カウンターを使用して、特定のアプリケーション (C で記述) を分析しようとしています。
AMD ネイティブ イベント CPU_CLK_UNHALTED を PAPI_TOT_CYC (合計サイクルをカウント) に使用し、DATA_CACHE_ACCESSES を PAPI_L1_DCA (L1 データ キャッシュ アクセスをカウント) に使用する PAPI v4.1.3.0 を使用しています。
私が経験した問題は、場合によってはキャッシュ アクセスの数が合計サイクル数よりも多いということです。私の理解では、キャッシュアクセスはCPUを停止させないので、合計サイクル内に収まるはずです。また、合計サイクル数を Opteron 6172 のクロック周波数で割ると、かなり正確な実行時間の見積もりが得られます。これにより、合計サイクル数は問題なく、問題はデータ キャッシュ アクセスのカウントにあると思われます。
私は papi の例に従ってすべてを開始しましたが、エラーはまったく発生しません。これが発生する理由についての助けや理由は大歓迎です。事前に感謝します。
http://support.amd.com/us/Processor_TechDocs/31116.pdf
- CPU_CLK_UNHALTED
CPU が (STPCLK または HLT 命令により) 停止状態にないクロック数。注: このイベントにより、システムのアイドル時間が IPC (または CPI) の測定値から自動的に除外され、OS がアイドル時に CPU を停止することが可能になります。OS が停止せずにアイドル ループに入った場合、そのような計算はアイドル ループの IPC の影響を受けます。
- DATA_CACHE_ACCESSES
ロードおよびストア参照のためのデータ キャッシュへのアクセス数。これには、特定のマイクロコードのスクラッチパッドへのアクセスが含まれる場合がありますが、これらは一般的にまれです。各インクリメントは 8 バイト アクセスを表しますが、命令はその一部にしかアクセスしていない場合があります。このイベントは投機的なイベントです。
opengl - Ubuntu 12.04 / usr / bin / ld:エラー:-lGLが見つかりません
fglrx ATI / AMD独自のドライバをインストールしましたが、OpenGL / SDLプロジェクトを起動しようとすると、次のメッセージが表示されます:/ usr / bin / ld:エラー:-lGLが見つかりません
Ubuntu 12.04デスクトップ、64ビットを実行しています。HD6870 [ATI RadeonHD6800シリーズ]
x86-64 - AMD の MP 仕様、コードを使用して AMD に関してマルチプロセッサを起動する方法
マルチプロセッサをサポートする OS を作成しようとしていますが、AMD のマルチプロセッサをブートストラップする方法がわかりません。AMD のホームページを検索して MP 仕様を見つけましたが、見つかりませんでした。リンクを教えてもらえますか?住所?
azure - Windows Azure の CPU ブランド (Intel または AMD または Any) は何ですか?
VM Azure でアプリケーションをホストしたいのですが、それには Intel CPU 命令が必要です。「コンピュータ メニュー」のプロパティを開くと、VM に AMD タイプが表示されました。これはAzureの互換CPUだと思います。
Windows Azure の実際の CPU ブランド (Intel、AMD、または Any) は何ですか?
opengl-es-2.0 - ここでvalgrindは「無効なアドレスにジャンプする」とはどういう意味ですか?
正確には何が問題ですか?
このアプリケーションを実行すると、セグメンテーション違反エラーが発生して終了します。これは、AMD GLES SDKforDesktopでコンパイルされたOpenGLES2.0アプリケーションです。
これは、このアプリケーションのソースです。
ubuntu - CPU アーキテクチャの略語について
PCにubuntuをインストールしました。次に、その CPU アーキテクチャを知りたいと思います。これには uname -a を使用できることを読みました。
このページから:
http://en.wikipedia.org/wiki/X86-64
私はそれがAMD CPUであると推測しました。しかし、私が実行した場合:
インテルクアッドコアであることを示しています。私も実行しようとしましたlscpu:
The: ベンダー ID: GenuineIntel
インテル CPU を示します。それで、このマシンに搭載されているCPUは何ですか?