私は8x8のデータを持っています。処理後、結果の 8x8 データを次の処理のためにしばらく保持したいと考えています。私の質問は、ループで保存するように 4 つの Q レジスタをプログラムできるかどうかです。しかし、次のコードはコンパイルされません。d12 の 12 を d13 にインクリメントするのも好きです。
mov r4, #7
1:
.
.
vmul.i16 d12, d12, d1[r4]
subs r4, r4, #1
bge 1b
これらを処理する方法または効率的な方法はありますか?