Cortex A15 用にコンパイル済みの ARM ツール チェーンがあります。正しい VFPv4 命令が生成されるかどうかを確認したい。どんな体にもアイデアはありますか?
2827 次
1 に答える
3
gccリリースログで調べることができます。
...
GCC now supports VFPv4-based FPUs and FPUs with single-precision-only VFP.
...
手動で確認することもできます。ARMアーキテクチャマニュアルによると、VFPv4は少なくとも追加されましVector Fused Multiply Accumulate / Subtract
た。
void test_vfp4() {
asm("VFMA.F32 q1, q2, q3");
}
これをスイッチでコンパイルし-mfpu=neon-vfpv4
ます(そうでない場合、私のツールチェーンは言いますError: selected processor does not support ARM mode 'vfma.f32 q1,q2,q3'
)
gcc -mfpu=neon-vfpv4 -O2 -marm -c vfpv4.c
とのバイナリをダンプします
arm-linux-gnueabihf-objdump -S vfpv4.o
以下にリストする必要があります
00000000 <test_vfp4>:
0: f2042c56 vfma.f32 q1, q2, q3
4: e12fff1e bx lr
ただし、これらの融合された命令にリストされている組み込み関数が見つからなかったため、または他の方法を考えられなかったため、Cレベルでこれをどのように使用できるかわかりません。
于 2012-10-09T08:41:25.897 に答える