問題タブ [cuda]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - CUDA コンパイラ (nvcc) マクロ
使用できる CUDA の #define コンパイラ (nvcc) マクロはありますか? (Windows の _WIN32 など)。
これは、nvcc コンパイラと VC++ コンパイラの間で共通するヘッダー コードに必要です。先に進んで独自に定義し、nvcc コンパイラ (-D) に引数として渡すことができることはわかっていますが、既に定義されているものがあると便利です。
algorithm - 近似解アルゴリズムの設計方法
写真の一部を取り、それらを同じオブジェクトの別の写真と照合できるアルゴリズムを書きたいと思います。
たとえば、コンピューターに花瓶の写真と、花瓶が入っているシーンの写真を与えた場合、花瓶が画像のどこにあるかをコンピュータが判断することを期待します。このようなアルゴリズムの開発をどのように開始しますか?
このアルゴリズムの最終的な使用法は、たとえば、誰かの顔の写真を使って、その人が大勢の人の中にいるかどうかを判断できるアプリケーションです。このアルゴリズムは、最終的にビデオ ストリームに適用されます。
編集:すぐに解決したくないので、この問題の実際の解決策は期待していません。本当の問題は、このようなものをコンピューターにどのように定義して、それを実行するアルゴリズムを作成できるかということでした.
ありがとう
cuda - 並列数学のためのCUDA対DirectX10。あなたはそれについて何か考えを持っていますか?
並列数学のためのCUDA対DirectX10。あなたがそれについて持っている考えはありますか?
c - C、CUDA、および ANN 初心者へのアドバイスはありますか?
私はビジネス専攻で、学位プログラムの 3 分の 2 を終え、PHP の経験が少しあり、C++ の入門クラスを 1 つ受講しましたが、今ではプログラミング/コンピューター サイエンスよりもビジネスを選択したことを後悔しています。
より高度なプログラミングを学ぶことに興味があります。具体的にはCであり、最終的には人工ニューラルネットワークのデータ分析にCUDAアーキテクチャを使用するようになりました(AI、ビジョン、または音声処理ではなく、大規模なデータセットのデータポイントと一般的なデータ/統計分析の相関関係を見つけるため)。
C の学習を開始する方法について何かアドバイスはありますか? データを分析するための ANN/ベイジアン技術と同様に? たくさんの本がありすぎて、どれを選べばいいのかわからない。
CUDA はかなり新しいので、学習者にとって使いやすい (つまり、単純化された) 教材はあまりないように思われます。NVIDIA ドキュメント以外に CUDA の学習リソースはありますか?
さらに、GPGPU コンピューティングと大規模並列プログラミングについて説明している中で、どのリソースをお勧めしますか?
random - CUDA の乱数ジェネレーター
私は一日中これに苦労してきました.CUDAコードでスレッド用の乱数ジェネレーターを取得しようとしています. 私はすべてのフォーラムを調べましたが、このトピックはかなり出てきますが、あらゆる種類のコードを解明しようとして何時間も費やしましたが、役に立ちませんでした. 誰かが簡単な方法を知っていれば、おそらくデバイスカーネルを呼び出して、0 から 1 の間のランダムな浮動小数点数、または変換できる整数を返すことができます。
ここでも、たとえば rand() のように、カーネルで乱数を使用したいと考えています。
前もって感謝します
cuda - 「初心者向け」分散処理プロジェクト
私は AI の研究に非常に興味があるので、家庭用のスーパーコンピューターを作ろうとして、異種ノードのクラスターを構築することに長い間興味を持っていました。
ただし、問題は、私が無数のハードウェアを持っているにもかかわらずです (2 台のデュアル クワッド ラック マウント サーバー、8 台の 285GTX Gpu、6 台の PS3、2 台のハッキングされた 360 (Linux を実行できます) は、多数の一般的な PC といくつかのワークステーションにアクセスできます)。クランチする必要がある大規模なデータセットはなく、分散して実行できるソフトウェアさえありません。私は分散コードのコンパイルをいじりましたが、せいぜいカーネルのビルドに 10 分 (最悪の場合) が 30 秒かかりました (そのうちの 20 秒はセットアップに過ぎないと思います)。
では、どこから始めればよいでしょうか。私は Obj-C/C/C++ について十分に理解しているので、何かを書くのはそれほど難しいことではありませんが、何を書くべきでしょうか?
multidimensional-array - CUDA のデバイス メモリに 2D 配列を割り当てる
Cudaのデバイスメモリに2D配列を(ホストとの間で)割り当てて転送するにはどうすればよいですか?
c - UBUNTU 9.04でCUDA開発を開始するにはどうすればよいですか?
Ubuntu 9.04でCUDA開発を開始するにはどうすればよいですか?ビルド済みのバイナリはありますか?デフォルトのアクセラレーションドライバーで十分ですか?
私の考えは実際にOpenCLで動作することですが、今のところそれを行うのは難しいようです。そのため、CUDAから始めて、より簡単に利用できるようになったらアプリケーションをOpenCLに移植することを考えました。
cuda - cudaMemcpyToSymbol はデータをコピーしません
__constant__
すべてのカーネルのすべてのスレッドがアクセスするメモリを使用したいと考えています。
宣言はこのようなものです
を使用してこの変数にデータをコピーしています
Smooth_size = 7K バイト
それは私に間違った出力を与えていました
しかし、-deviceemu
モードで実行し、カーネル内のこれらの両方の変数の内容を出力しようとすると、スムーズですべてゼロになり、smooth_local は正しくなりました。
cudaMemcpyToSymbol
まだ0が表示された直後に出力を印刷しようとしました。
誰でも私の問題に光を当てることができますか?