私のOpenCL
カーネルでは、これを見つけました:
error += y;
++y;
error += y;
// The following test may be implemented in assembly language in
// most machines by testing the carry flag after adding 'y' to
// the value of 'error' in the previous step, since 'error'
// nominally has a negative value.
if (error >= 0)
{
error -= x;
--x;
error -= x;
}
明らかに、これらの操作は、気の利いたアセンブリ命令を使用して簡単に最適化できます。でこのコードを最適化するにはどうすればよいOpenCL
ですか?