シンプルで安価なデュアルコア intel-3ghz-debian と、超高価な powerPc7-Aix へのアクセスがあります。
そして、数日間の闘争の後、libx264 をコンパイルし、両方のコンピューターでテストしました。
- GCC: Intel 上のライブラリ x264 (SSE2 機能付き) および
- 16 コアの powerPc 上の GCC (altivec を使用)。
...そしてその結果、安価な Intel はx2 倍高速です! (altivec を無効にすると、Intel は 10 倍速くなります)
私の質問: これは正常ですか? 他のすべての powerPC ユーザーの結果は同じですか? x264 ライブラリの powerPc-altivec-optimisation は Intel と同じ速度で動作しますか? または MMX/SSE 最適化は公式にはこのライブラリで少なくとも 2 倍高速ですか?
マルチスレッドオプションには興味がありません。コア数とスレッド数は関係ありません。rawvideo をソースとして使用するデフォルトの「ミディアム プリセット」を使用したシンプルな 1 スレッド x264 エンコーディング、sse と altivec の比較。
ネイティブの Aix XLC コンパイラがより良い結果を提供するのではないでしょうか? (私はgccのみが動作するように管理しました)
... mac-powerpc-users は、これについて何か知っているかもしれません。
powrPc7-Aix:$ time (cat raw10sec.y4m |x264 --input-res 720x576 --fps 50 -o /dev/null -)
x264: 64-bit XCOFF
x264 [info]: using cpu capabilities: Altivec
time: real 0m33.559s
---
intelDebian:$ time (cat raw10sec.y4m |x264 --input-res 720x576 --fps 50 -o /dev/null -)
x264: ELF 32-bit LSB executable
x264 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 FastShuffle SSE4.1 Cache64
time: real 0m16.503s