TMS320C64x 用の DSP アクセラレーション アプリケーションを作成するプログラマ向けのクイックスタート ガイドはありますか?
カスタム アルゴリズム (fft または usial フィルタリングではない) を使用するプログラムがあり、マルチ DSP コプロセッサを使用して高速化したいと考えています。では、計算をメイン CPU から DSP に移動するには、ソースをどのように変更すればよいでしょうか? DSP 実行コードにはどのような制限がありますか?
私はCUDAの経験があります。CUDA では、すべての関数をホスト、デバイス、またはデバイス (カーネル) のエントリ ポイントとしてマークする必要があります。カーネルを起動したり、GPU との間でデータをアップロード/ダウンロードしたりする関数もあります。CUDA リファレンス マニュアルで説明されているように、デバイス コードにはいくつかの制限もあります。DSP 用の同様のインターフェイスとドキュメントがあることを願っています。