問題タブ [auto-vectorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
gcc - gcc の x86-64 オートベクトライザーで pshufb オペコードを出力するには、どの C 命令を使用する必要がありますか?
ssse3 オペコード pshufb を使用して 0xPQ を 64 ビット値 0xPQPQPQPQPQPQPQPQ に変換する gcc の自動ベクトル化 (つまり、組み込み関数ではない) が必要です。ただし、pshufb オペコードが gcc によって他の用途に出力されていることは確認できますが (したがって、コンパイラは間違いなくそれを出力できます)、この特定のケースでそれをトリガーするために必要な一連の C 命令を解決できません。
助言がありますか?ありがとう!
python - Pandas データフレームのベクトル化
これは、データ フレーム A の特定の要素を、B を介してデコードされた値に応じて NaN に設定する必要があるデータ クリーニングの演習です。
3 ネストされたループが 17 時間実行される次のコードを作成しました。
ボトルネックは長い外部ループであると思われます.100len(A)
万までです。したがって、これは Pandas を使用する最良の方法ではありません。代わりに、次の方法を使用します。
ただし、後者は例外をスローします。
2 つの質問:
- パフォーマンスのボトルネックとベクトル化のメリットについて、私の理解は正しいでしょうか?
- if条件を正しい方法で表現する方法
- Y の計算は高価ではありません。A データフレームの操作方法を決定するためのルックアップ配列です。
gcc - gcc 自動ベクトル化 - 出力メッセージの理解
現在、gcc ベクトライザーの出力を理解しようとしています。-O2 -ftree-vectorize -fopt-info-vec-all
gcc 8.2.0を使用してプログラムをコンパイルしました。
ただし、一部の出力メッセージの意味がわかりません。また、インターネット上で説明を見つけることができないようです。
次の例の PHI は何を意味しますか?
そして、ここでの問題は何ですか?
どんな助けでも大歓迎です。
(問題を解決するための助けを求めているわけではありません。そもそも問題が何であるかを理解しようとしているだけです)