固定長6int配列の最速のソートに関して、このソートネットワークが挿入ソートのようなアルゴリズムをどのように凌駕するかを完全には理解していません。
その質問から、ソートを完了するために必要なCPUサイクル数の比較を次に示します。
Linux 32ビット、gcc 4.4.1、Intel Core 2 Quad Q8300、-O2
- 挿入ソート(Daniel Stutzbach):1425
- ソーティングネットワーク(Daniel Stutzbach):1080
使用されるコードは次のとおりです。
挿入ソート(Daniel Stutzbach)
static inline void sort6_insertion_sort_v2(int *d){
int i, j;
for (i = 1; i < 6; i++) {
int tmp = d[i];
for (j = i; j >= 1 && tmp < d[j-1]; j--)
d[j] = d[j-1];
d[j] = tmp;
}
}
ソーティングネットワーク(Daniel Stutzbach)
static inline void sort6_sorting_network_v1(int * d){
#define SWAP(x,y) if (d[y] < d[x]) { int tmp = d[x]; d[x] = d[y]; d[y] = tmp; }
SWAP(1, 2);
SWAP(0, 2);
SWAP(0, 1);
SWAP(4, 5);
SWAP(3, 5);
SWAP(3, 4);
SWAP(0, 3);
SWAP(1, 4);
SWAP(2, 5);
SWAP(2, 4);
SWAP(1, 3);
SWAP(2, 3);
#undef SWAP
}
一部のステップは他のステップから独立しているため、ソーティングネットワークは並列ソートに非常に適していることを理解しています。ただし、ここでは並列化を使用していません。
正確な要素数を事前に知っているという利点があるので、より高速になると思います。挿入ソートはどこで、なぜ不必要な比較を行うのですか?
編集1:
これは、これらのコードが比較される入力セットです。
int d[6][6] = {\
{1, 2, 3, 4, 5, 6},\
{6, 5, 4, 3, 2, 1},\
{100, 2, 300, 4, 500, 6},\
{100, 2, 3, 4, 500, 6},\
{1, 200, 3, 4, 5, 600},\
{1, 1, 2, 1, 2, 1}\
};\