問題タブ [reduction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1611 参照

multithreading - 複数の CPU スレッドから CUDA カーネルを呼び出す (共有メモリを使用)

配列内の最小値を見つけるために、共有メモリを使用してリダクションを実行する cuda カーネルを作成しました。これは、ここにあるよく知られた例と非常によく似ています。

https://www.sharcnet.ca/help/index.php/CUDA_tips_and_tricks#Reduction

単一の CPU スレッドから実行している場合、ブロックごとに任意の数の CUDA スレッドで正常に動作します (デバイスの最大数: 1024 まで)。

ブロックあたりの CUDA スレッドの数が十分に少ない (256) いくつかの (20) CPU スレッドから実行すると、正常に動作します。

しかし、マルチ CPU スレッドで CUDA スレッドの数を増やすとすぐに、すべてがクラッシュします。

リダクションを実行するカーネルの行を削除しようとしました (そのため、アレイにはいくつかの操作のみが残りますが、CUDA スレッド間の通信はありません)。任意の数の CPU スレッドからブロックごとに任意の数の CUDA スレッドで正常に動作します。 .

私の問題がどこから来たのかについてのアイデアはありますか? それを修正する方法はありますか?よろしくお願いします。

PS: 単一の GTX650 を使用しています。

PS2: 私の英語力が少し下手で申し訳ありませんが、それは私の母国語ではありません....

0 投票する
4 に答える
1570 参照

php - 必要に応じてフォントをロードする PHP スクリプト

「必要に応じて」フォントを追加する方法を探しています。

この特定のサイトを構築するときに、最初に 4 つの Google API フォントを選択しました。大きくなったので、フォントの選択を9種類に増やしたいと思います。

PHP を介してこれを行う方法を見つけようとしていますが、私はデザイナーなので、私の php は 'eh' です。

これが私がphpについて知っていることからの「ラフドラフト」です。

誰か私を助けてくれませんか?

次に、これをWebページで。

また、リンク タグには | が必要です。フォント名の間に...これを行う方法がわかりません。Google が提供するすべての形式は < link href='http://fonts.googleapis.com/css?family=Cardo:400,400italic|Crimson+Text:700italic|Euphoria+Script|Philosopher:400,400italic|Vollkorn です。 :400,400italic,700|Josefin+Slab:400,700|Redressed|Aladin|Rouge+Script' rel='stylesheet' type='text/css' >

ありがとう!

0 投票する
1 に答える
498 参照

cuda - CUDA SDK の Reduce3 の例

CUDA SDK でリダクションの最適化を読んでいますが、reduce2 から reduce3 に何が起こるかを追跡する際に問題があります。

reduce3 の最初のレベルの削減が何をしようとしているのか、またはスレッド数が半分に削減された理由を視覚化するのに問題があります。誰かが私にいくつかの指針を与えることができますか?

0 投票する
1 に答える
267 参照

functional-programming - 実際のラムダ計算

ラムダ項 (λx.y)((λx.xxx)(λx.xxx)) を実際に計算する言語の選択方法 つまり、通常の順序削減と弱い型システムに言語が必要です。

0 投票する
3 に答える
171 参照

r - データ フレーム内に埋め込まれたリストからダミー (T/F) 変数を取得する

セルに用語のリストが含まれる data.frame があります。

そのリストで見つかった各用語に対して、その特定のセルに用語が存在するかどうかを示す新しい変数を生成したいと考えています。

私は data.frame に複数の異なるインスタンスを持っており、リストの構成について優先順位を知りません。

例 data.frame

これから、私は取得したい

0 投票する
6 に答える
12800 参照

algorithm - TSP をハミルトン閉路に縮小する

巡回セールスマン問題の (決定版) をハミルトン閉路問題に変換するにはどうすればよいですか (つまり、TSP を HCP に還元して、HCP の解決策がある場合、その解決策を使用して TSP 問題を解決する方法)。

0 投票する
1 に答える
1557 参照

matrix - OpenCL での行列行の削減

GPU に 1D 配列として格納されている行列があります。たとえば、この行列のすべての行でリダクションを使用する OpenCL カーネルを作成しようとしています。

私の行列が要素[1、2、3、4、5、6]を持つ2x3であると考えてみましょう。私がやりたいことは次のとおりです。

明らかに削減について話しているので、実際の戻り値は行ごとに複数の要素になる可能性があります。

次に、別のカーネルまたは CPU で実行できる最終的な計算です。

さて、これまでのところ、削減を行うカーネルですが、次のように配列のすべての要素を使用しています。

これを行うための実際のリダクション カーネルはその 1 つです (これは、実際にはスタック オーバーフローでここから取得しました)。

0 投票する
1 に答える
4941 参照

c - MPI_Reduceが期待どおりに機能しない

私はMPIを初めて使用し、MPI_Reduceを使用して整数配列の最大値を見つけようとしています。arrサイズの整数配列がarraysizeあり、コードは次のとおりです。

私のプログラムは8つのプロセスで問題なくコンパイルおよび実行されますが、画面には何も出力されません。デバッグの目的で、条件をif(my_process_id)(なしで!)に変更して実行します。00030000次に、3がこのリストのどこかに非決定的に存在する可能性があるなどの奇妙な出力が得られます。3は私の配列の最初の値です(ただし最大値ではありません)。私は一般的に並列プログラミングについて知っていますが(専門家ではありませんが、通常は自分が何をしているのかを知っています)、MPIは非常に新しいので、明らかな間違いをしている可能性があります。私がオンラインで見たすべてのチュートリアルには、私のようなコードサンプルがあり、何が間違っているのかわかりません。

ありがとう、

できる。

0 投票する
1 に答える
373 参照

turing-machines - L = {T | T は {00, 01}} を認識するチューリング マシンです。L が決定不能であることを証明します。

L = {<T> | T は {00, 01}} を認識するチューリング マシンです。

L が決定不能であることを証明します。

ここで使用する削減を理解することさえ本当に困難です。

私は無料の昼食を求めているのではなく、正しい方向へのプッシュを求めているだけです.

0 投票する
1 に答える
541 参照

for-loop - OpenMP から CUDA へ: リダクション

for reduction()CUDA でOpenMP に相当するものを使用する方法を理解しようとしています。私はオンラインでいくつかの調査を行いましたが、試したことはどれもうまくいきませんでした。コード:

for reduction()はOpenMPで何をするか知っています....それはforループの最後の行を可能にします。しかし、CUDA を使用して同じことを表現するにはどうすればよいでしょうか?

ありがとう!