この癖に出くわしたとき、私はただいじっていました。そして、私は自分が狂っていないことを確認したかった.
次のコード (2.x および 3.x で動作):
from timeit import timeit
print ('gen: %s' % timeit('"-".join(str(n) for n in range(1000))', number=10000))
print ('list: %s' % timeit('"-".join([str(n) for n in range(1000)])', number=10000))
各バージョン、同じマシンで 3 回実行します。
注:ここではスペースを節約するために、タイミングを同じ行にグループ化しました。
私のPython 2.7.5では:
gen: 2.37875941643, 2.44095773486, 2.41718937347
list: 2.1132466183, 2.12248106441, 2.11737128131
私のPython 3.3.2では:
gen: 3.8801268438439718, 3.9939604983350185, 4.166233972077624
list: 2.976764740845537, 3.0062614747229555, 3.0734980312273894
これはなぜなのだろうか....文字列の実装方法と関係があるのでしょうか?
編集:range()
これも2.xから3.xにわずかに変更されたため、使用せずにもう一度やりました。代わりに、以下の新しいコードを使用します:
from timeit import timeit
print ('gen: %s' % timeit('"-".join(str(n) for n in (1, 2, 3))', number=1000000))
print ('list: %s' % timeit('"-".join([str(n) for n in (1, 2, 3)])', number=1000000))
Python 2.7.5 のタイミング:
gen: 2.13911803683, 2.16418448199, 2.13403650485
list: 0.797961223325, 0.767758578433, 0.803272800119
Python 3.3.2 のタイミング:
gen: 2.8188347625218486, 2.882846655874985, 3.0317612259663718
list: 1.3590610502957934, 1.4878876089869366, 1.4978070529462615
EDIT2:計算を中断するものがいくつかあったようです。そのため、最小限に抑えてみました。
新しいコード:
from timeit import timeit
print ('gen: %s' % timeit('"".join(n for n in ("1", "2", "3"))', number=1000000))
print ('list: %s' % timeit('"".join([n for n in ("1", "2", "3")])', number=1000000))
タイミング Python 2.7.5:
gen: 1.47699698704, 1.46120314534, 1.48290697384
list: 0.323474182882, 0.301259632897, 0.323756694047
タイミング Python 3.3.2:
gen: 1.633002954259608, 1.6049987598860562, 1.6109927662465935
list: 0.5621341113519589, 0.5789849850819431, 0.5619928557696119
違いは明らかです。2.x では速く、3.x では遅くなります。その理由が気になります...