結果の(やや予想外の)理由は、Pythonが浮動小数点の乗算とべき乗を含む定数式を折りたたむように見えるが、除算は含まないように見えることです。math.sqrt()
バイトコードがなく、関数呼び出しが含まれるため、まったく別の獣です。
Python 2.6.5では、次のコードがあります。
x1 = 1234567890.0 / 4.0
x2 = 1234567890.0 * 0.25
x3 = 1234567890.0 ** 0.5
x4 = math.sqrt(1234567890.0)
次のバイトコードにコンパイルされます。
# x1 = 1234567890.0 / 4.0
4 0 LOAD_CONST 1 (1234567890.0)
3 LOAD_CONST 2 (4.0)
6 BINARY_DIVIDE
7 STORE_FAST 0 (x1)
# x2 = 1234567890.0 * 0.25
5 10 LOAD_CONST 5 (308641972.5)
13 STORE_FAST 1 (x2)
# x3 = 1234567890.0 ** 0.5
6 16 LOAD_CONST 6 (35136.418286444619)
19 STORE_FAST 2 (x3)
# x4 = math.sqrt(1234567890.0)
7 22 LOAD_GLOBAL 0 (math)
25 LOAD_ATTR 1 (sqrt)
28 LOAD_CONST 1 (1234567890.0)
31 CALL_FUNCTION 1
34 STORE_FAST 3 (x4)
ご覧のとおり、乗算とべき乗はコードのコンパイル時に行われるため、時間はかかりません。分割は実行時に発生するため、時間がかかります。平方根は、4つの中で最も計算コストの高い操作であるだけでなく、他の操作では発生しないさまざまなオーバーヘッド(属性検索、関数呼び出しなど)も発生します。
定数畳み込みの影響を排除すると、乗算と除算を分離することはほとんどありません。
In [16]: x = 1234567890.0
In [17]: %timeit x / 4.0
10000000 loops, best of 3: 87.8 ns per loop
In [18]: %timeit x * 0.25
10000000 loops, best of 3: 91.6 ns per loop
math.sqrt(x)
x ** 0.5
おそらく後者の特殊なケースであり、したがってオーバーヘッドにもかかわらず、より効率的に実行できるため、実際にはよりも少し高速です。
In [19]: %timeit x ** 0.5
1000000 loops, best of 3: 211 ns per loop
In [20]: %timeit math.sqrt(x)
10000000 loops, best of 3: 181 ns per loop
編集2011-11-16:定数式の折りたたみは、Pythonののぞき穴オプティマイザーによって行われます。ソースコード(peephole.c
)には、定数除算が折りたたまれない理由を説明する次のコメントが含まれています。
case BINARY_DIVIDE:
/* Cannot fold this operation statically since
the result can depend on the run-time presence
of the -Qnew flag */
return 0;
このフラグは、 PEP238-Qnew
で定義されている「真の除算」を有効にします。