“loop-unrolling”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

703 参照

c - GCC 5.1 ループ展開

次のコードを考えると

GCC 5.1 以降を使用する

ループ展開を部分的に行い、ループを 10 回展開してから条件付きジャンプを実行します。

しかし、4.9.2 などの古いバージョンの GCC を使用すると、目的のアセンブリが作成されます

それ以降のバージョンの GCC で同じ出力を生成するように強制する方法はありますか?

https://godbolt.org/g/D1AR6iを使用してアセンブリを生成する

編集: GCC の新しいバージョンでループを完全に展開する問題はまだ解決されていないため、重複する質問はありません。パス--param max-completely-peeled-insns=1000 --param max-completely-peel-times=10000は、GCC >= 5.1 を使用して生成されたアセンブリには影響しません

2016-06-22T12:00:34.687

0 投票する

0 に答える

53 参照

c - 速度が最適化された複数レジスタの複数ビットアクセスのための C のインライン関数でのループ展開

マイクロコントローラーのディスクリート IO チェックに関連する次の問題を最もエレガントに解決する方法について質問があります。

.c ファイルの内容:

N_USED が 7 に定義され、REGx_ADDR も有効なレジスタアドレスであると定義されている場合、 --O3 --funroll-loops を使用してコンパイルした後に期待される結果は、testfunction の次の同等の C コードのように速度が最適化されます。

ARM v7 用の GCC コンパイラを使用しています。これは、testfunction によって呼び出される上記のインライン関数 Dinputs を使用すると、最適化されたマシンコード出力で期待どおりに機能しますか? Dinputs 関数の展開とインライン化を強制する可能性はありますか? あまり重要ではありませんが、念のため: 上記の例の構造体転送 DIO は、展開されたインライン関数によってのみ使用されるため、コンパイラがこのデータをオブジェクトファイルのデータセクションに引き継ぐ必要はありません。予想される動作は何ですか。これ？

私のプロジェクトで同等のコードを使用したくない理由は、コンパイル時に N_USED が 0 から 7 の範囲 (この例では) である場合、多くの追加のプリプロセッサコマンドが必要になり、他の DIO を使用するバリアントが必要になるためです。テーブルは、コードではなくテーブルを交換するだけで、より簡単に定義できます。

c optimization inline loop-unrolling

2016-08-23T21:48:29.553

0 投票する

1 に答える

6559 参照

c++ - GCC でのループ展開動作

この質問は、GCC 5.1 Loop unrollingへのフォローアップの質問の一部です。

GCC のドキュメントによると、上記の質問に対する私の回答で述べたように、「完全なループピーリング (つまり、小さな一定回数の反復でループを完全に削除する)」-funroll-loopsなどのフラグをオンにします。したがって、このようなフラグが有効になっている場合、コンパイラは、これが特定のコードの実行を最適化すると判断した場合に、ループを展開することを選択できます。

それにもかかわらず、私のプロジェクトの 1 つで、関連するフラグが有効になっていない場合でも、 GCC がループをアンロールすることがあることに気付きました。たとえば、次の単純なコードを考えてみましょう。

でコンパイルすると-O1、ループが展開され、最新バージョンの GCC で次のアセンブリコードが生成されます。

-fno-unroll-loops -fno-peel-loopsフラグが無効になっていることを確認するために追加でコンパイルした場合でも、GCC は予期せず、上記の例でループ展開を実行します。

この観察は、次の密接に関連した質問に私を導きます。この動作に対応するフラグが無効になっているにもかかわらず、GCC がループ展開を実行するのはなぜですか? アンロールは、無効になっている場合でも、コンパイラがループをアンロールする可能性がある他のフラグによっても制御され-funroll-loopsますか? GCC でループのアンローリングを完全に無効にする方法はあり-O0ますか?

興味深いことに、Clangコンパイラはここで期待どおりの動作をしており、-funroll-loops有効な場合にのみ展開を実行し、それ以外の場合は実行しないようです。

事前に感謝します。この問題に関する追加の洞察をいただければ幸いです。

c++gcc compiler-optimization loop-unrolling

2016-09-13T20:04:46.317

0 投票する

0 に答える

78 参照