double のかなり大きな (1040x1392) マトリックスがあり、列が最初のマトリックスの 16x16 パッチである別のマトリックスを抽出したいと考えています。(私は知っています、それは多くのデータであり、それを使用するのは実用的ではないかもしれませんが、これはうまくいくはずです...)
「データ」が元の行列であるこのコードを使用してみました:
# Create a matrix of starting coordinates for each patch
patch.size = 16
patch.inc = patch.size - 1
coords = expand.grid(x=1:(ncol(data)-patch.inc), y=1:(nrow(data)-patch.inc))
coords = as.matrix(coords)
# Pre-allocate the destination matrix
patches = double(nrow(coords)*patch.size^2)
dim(patches) = c(patch.size^2, nrow(coords))
#Create overlapping patches
for (i in 1:nrow(coords))
{
x=coords[i,1]
y=coords[i,2]
patches[,i] = as.vector(data[y:(y+patch.inc), x:(x+patch.inc)])
}
これは、8 GB の RAM を搭載した適度に高速な Win7-64 マシンでは信じられないほど遅く実行されます。100 個のパッチを作成するだけでも時間がかかります。
パッチ[、i]への割り当てが問題であることが判明しました。タスク マネージャーを見ると、パッチに割り当てるとメモリ使用量が急増しています[,i]。
いくつか質問があります。まず、何が起こっているのですか?割り当てごとにパッチ マトリックス全体がコピーされているようです。そうですか?もしそうなら、なぜですか?パッチマトリックスを事前に割り当てることでそれを回避できると思いました。第二に、このコードを書くためのより良い方法はありますか?
ありがとう!ケント