問題タブ [fpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
598 参照

assembly - FPU は nan を fld に格納します

アセンブリで DOS プログラムを書いています。マンデルブロー集合を描こうとしています。私は今、このCコードをアセンブリで翻訳しようとしています:

私はそれを次のように翻訳しました:

残念ながら、最初fldは失敗します。WD デバッガーは、それがFPU レジスターにfld格納nanされていることを教えてくれます。ST(0)なんで?私は何を間違っていますか?完全なプログラムは次のとおりです: http://pastebin.com/KDrn5aLD

0 投票する
2 に答える
528 参照

x86 - x86: 超越関数のレイテンシーとスループット

インテル® 64 および IA-32 アーキテクチャー最適化リファレンス・マニュアルには、さまざまな CPU 命令のレイテンシーとスループットの数値がリストされています。

超越関数 (FSINなど) については、数値の一部が範囲としてリストされています (ページ C-29)。脚注 4 は次のように説明しています。

超越命令のレイテンシとスループットは、動的な実行環境では大幅に異なる場合があります。これらの指示については、おおよその値または値の範囲のみが示されています。

私の質問は、そのような命令のスループットとレイテンシに影響を与える要因は何ですか? 引数の値が 1 つの要因であると思います。他にもありますか?

0 投票する
0 に答える
929 参照

assembly - tasm コード fpu 浮動小数点ユニット

ねえm trying to calculate x^n by a public function xpn that gets double x and int n so i have to calculate in array x^1 , X^2 , x^4 ..... x^k k<n then i have to multiple xp=1 with array[i] if (n mod 2)=1 if not n=n/2 ,and i=i+1 so somebody can help me because it is not working !! i don、qword ptr のような変換を行う方法を知っています。これは tasm assemblyly fpu= 浮動小数点ユニットです。double m trying to do : ix と int n を取得し、xpn x^1、x^2、x^4 で計算しています。 ....x^k k0 { if n mod 2 = 1 xp=xp*xpn[i] n=n/2 i=i+1 } したがって、最後に x^n が得られます!!!!!

0 投票する
0 に答える
1447 参照

arm - ARMNEONOpenMAx番号のベンチマーク

私は現在、さまざまなコンパイラ(DS-5およびIARを試した)とさまざまなライブラリ(Openmax、NE10)を使用して、Cortex-A8プロセッサのパフォーマンスをベンチマークする作業を行っています。私は特に、NEONユニットが比較したときに何が達成できるかを確認するために取り組んでいます1.ARMのみ2.ARM + VFPv3

Openmaxには、2つのバージョンがあります。1。NEON用にカスタマイズされています。2。ArmプロセッサのサンプルコードOpenMaxを使用して次の表を作成しました。予想通り、NEONコードのパフォーマンスは比類のないものです。

https://docs.google.com/file/d/0B318pI7x2QVceWRDTE5FQk8zcVk/edit

NE10は、Cortexで現在利用可能な他の唯一の信号処理ライブラリです-AIはまだNE10ライブラリで作業中です。

これらの数値を他のプロセッサと比較する方法はありますか?またはプロセッサを比較するためのプログラム標準プログラムはありますか?

以下は、Openmaxapiへのリンクです http://www.khronos.org/files/openmax_dl_spec_1_0_2.pdf

0 投票する
1 に答える
847 参照

java - Android 環境での数値計算 (複素行列乗算) で GPU を使用できますか?

Android でカルマン フィルター アルゴリズムを実装しています。コードには、いくつかの複雑な行列乗算演算があります。行列要素は float 型です。私の質問は

1) Android では浮動小数点はどのように処理されますか??

2) GPU は、複雑な行列 (浮動小数点型の要素) 計算またはあらゆる種類の数値計算で使用できますか?

どうもありがとうございました

0 投票する
1 に答える
185 参照

assembly - アセンブリ x86-64 で longfloat と int を分割する

ユーザーが Y (はい) を入力している限りループするプログラムがあります。次に、ユーザーは long float 型のデータを入力します。また、長いフロートを入力するたびにカウントするカウンター r14 もあります。ループが終了したら、平均を計算したいと思います。私がこれを行う場合:

それを表示すると、セグメンテーション違反が発生します。私は他にもたくさんのことを試しましたが、常にセグが表示されます。分割して表示しようとするとエラーが発生します。問題は、r14がintであり、そのようにFPUスタックに入れて除算できないことだと思います。しかし、私は別の方法を理解できません。

誰か助けてくれませんか?前もって感謝します。

0 投票する
1 に答える
4942 参照

performance - FPU とソフトウェア エミュレーションの性能比較

私は浮動小数点コプロセッサが浮動小数点演算のどのソフトウェア実装よりも高速に動作することを知っていますが (だから私は言われました)、この違いがどれほど大きいかという直感を完全に欠いています。

答えはおそらく、アプリケーションと、マイクロプロセッサとスーパーコンピュータの間で作業する場所によって異なります。特にコンピューターシミュレーションに興味があります。

この質問に対する記事や論文を指摘していただけますか?

0 投票する
1 に答える
113 参照

fpu - _controlfp_sは上位32ビットを返しますか?

_controlfp_s unsigned intが返され、一部のODBC作業で32番目のビットが設定されている(16ビットのみが使用されていると考えられる)ことを示していますか?

誰かこれが何を意味するのか考えていますか?

通常、0x0008001F(64ビット)または0x0009001F(32ビット)のいずれかしか表示されませんが、サードパーティのドライバーまたはDLLがこれを0x8009001Fに設定しているように見える場合があります!!!!

サードパーティのソフトウェアがときどきこれを行うと、アプリケーションがランダムに閉じることに気づきました。

controlWord 10000000000010010000000000011111、

switchOffExceptions32bit 10010000000000011111、switchOffExceptions64bit 10000000000000011111

0 投票する
1 に答える
95 参照

compiler-construction - 単一のステートメントによって発生する潜在的な FPU 状態の検出

fenvオーバーフロー、アンダーフロー、不正確な結果などを生成するステートメントを探すために使用しています。

ただし、コンパイラがコードを並べ替えて、実際に必要な効果を実装しない可能性があると仮定するのは正しいですか? もしそうなら、関数の周りに「バリア」を作成するにはどうすればよいですかfe*(そうするための標準化された方法のボーナスポイントは?)揮発性ブロックをどこかにドロップできますか?

できればこれをテストするだけですが、方法がわかりません。

例:

編集:

それまでの間、揮発性ブロックを使用して、実質的にバリアを作成しています。

0 投票する
3 に答える
2226 参照

delphi - FLD 命令 x64 ビット

x64ビットのFLD命令で少し問題があります... st0レジスタのスタックポインタFPUにDouble値をロードしたいのですが、無理そうです。Delphi x32 では、次のコードを使用できます。

残念ながら、x64 では同じコードは機能しません。