python - 個々の値から小さなnumpy配列を構築する：高速で読みやすい方法？

Question

私のプログラムのボトルネックは、指定された値のリストからnumpy配列を作成することであり、最も一般的には4つの値を2x2配列に配置することです。それを行うための明白で読みやすい方法があります：

my_array = numpy.array([[1, 3], [2.4, -1]])

これには15人かかります-私は何百万回もやっているので非常に遅いです。

次に、はるかに高速で読みにくい方法があります。

my_array = numpy.empty((2,2))
my_array[0,0] = 1
my_array[0,1] = 3
my_array[1,0] = 2.4
my_array[1,1] = -1

これは10倍速く、たった1usです。

高速で読みやすい方法はありますか？

私がこれまでに試したこと：asarray代わりに使用しarrayても違いはありません。通過dtype=floatしてarrayも違いはありません。最後に、私は自分でそれを行うことができることを理解しています：

def make_array_from_list(the_list, num_rows, num_cols):
    the_array = np.empty((num_rows, num_cols))
    for i in range(num_rows):
        for j in range(num_cols):
            the_array[i,j] = the_list[i][j]
    return the_array

これにより、4usでアレイが作成されます。これは、中速で中程度の読みやすさです（上記の2つのアプローチと比較して）。しかし、実際には、組み込みメソッドを使用したより良いアプローチがないとは信じられません。

前もって感謝します！！

score 9 · Accepted Answer

これは素晴らしい質問です。完全に展開されたソリューションの速度に近づくものは見つかりません（編集 @BiRicoは何か近いものを思い付くことができました。コメントと更新を参照してください:)。これが私（そして他の人）が思いついたたくさんの異なるオプションと関連するタイミングです：

import numpy as np

def f1():
    "np.array + nested lists"
    my_array = np.array([[1, 3], [2.4, -1]])

def f2():
    "np.array + nested tuples"
    my_array = np.array(((1, 3), (2.4, -1)))

def f3():
    "Completely unrolled"
    my_array = np.empty((2,2),dtype=float)
    my_array[0,0] = 1
    my_array[0,1] = 3
    my_array[1,0] = 2.4
    my_array[1,1] = -1

def f4():
    "empty + ravel + list"
    my_array = np.empty((2,2),dtype=float)
    my_array.ravel()[:] = [1,3,2.4,-1]

def f5():
    "empty + ravel + tuple"
    my_array = np.empty((2,2),dtype=float)
    my_array.ravel()[:] = (1,3,2.4,-1)

def f6():
    "empty + slice assignment"
    my_array = np.empty((2,2),dtype=float)
    my_array[0,:] = (1,3)
    my_array[1,:] = (2.4,-1)

def f7():
    "empty + index assignment"
    my_array = np.empty((2,2),dtype=float)
    my_array[0] = (1,3)
    my_array[1] = (2.4,-1)

def f8():
    "np.array + flat list + reshape"
    my_array = np.array([1, 3, 2.4, -1]).reshape((2,2))

def f9():
    "np.empty + ndarray.flat  (Pierre GM)"
    my_array = np.empty((2,2), dtype=float)
    my_array.flat = (1,3,2.4,-1)

def f10():
    "np.fromiter (Bi Roco)"
    my_array = np.fromiter((1,3,2.4,-1), dtype=float).reshape((2,2))

import timeit
results = {}
for i in range(1,11):
    func_name = 'f%d'%i
    my_import = 'from __main__ import %s'%func_name
    func_doc = globals()[func_name].__doc__
    results[func_name] = (timeit.timeit(func_name+'()',
                                        my_import,
                                        number=100000),
                          '\t'.join((func_name,func_doc)))

for result in sorted(results.values()):
    print '\t'.join(map(str,result))

そして重要なタイミング：

Ubuntu Linuxでは、Core i7：

0.158674955368  f3  Completely unrolled
0.225094795227  f10 np.fromiter (Bi Roco)
0.737828969955  f8  np.array + flat list + reshape
0.782918930054  f5  empty + ravel + tuple
0.786983013153  f9  np.empty + ndarray.flat  (Pierre GM)
0.814703941345  f4  empty + ravel + list
1.2375421524    f7  empty + index assignment
1.32230591774   f2  np.array + nested tuples
1.3752617836    f6  empty + slice assignment
1.39459013939   f1  np.array + nested lists

score 0 · Accepted Answer

明らかに直感に反しますが、結果はそれほど驚くべきものではありません。NumPyは、非常に小さな配列を多数処理するようには設計されていません。代わりに、より大きなデータ配列を操作するように設計されました。

最初に、たとえばサイズの大きな配列を作成し、N*2*2それをデータで埋めてから、に形を変えることをお勧めします(N,2,2)。

補足として、あなたは試してみたいかもしれません

def f10():
    mine = np.empty((2,2), dtype=float)
    mine.flat = (1,3,2.4,-1)

この.flat方法は、この方法よりも大幅に効率的である必要があります.ravel()[:]=...（私の個人的なテストでは、@ mgilsonと同じ順序であることが示されていますf3）。

python - 個々の値から小さなnumpy配列を構築する：高速で読みやすい方法？

2 に答える 2

Related

Reference