大規模なラスターから作成したマトリックスが、親よりも 35,000 倍も多くのメモリを占有していることを発見して驚いています。このコードは次のことを示しています。
> # comparison with R's built-in volcano data
> object.size(volcano)
42656 bytes
> object.size(as.matrix(volcano))
42656 bytes
> # comparison with my data
> class(region_utm)
[1] "RasterLayer"
attr(,"package")
[1] "raster"
> dim(region_utm)
[1] 7297 7297 1
> object.size(region_utm)
12128 bytes
> region_mat = as.matrix(region_utm)
> dim(region_mat)
[1] 7297 7297
> object.size(region_mat)
425969872 bytes
object.size(region_utm)
特に 87% (46m) が一意の値であるため ( によると)、12,128 バイトでは 53m の値を含めるには、因数分解しても不十分であるため、確かに非常に過小評価されていますlength(unique(region_utm))
。現実的なメモリの見積もりを取得する方法がわからない..
ただし、ラスターをプロットする方が、マトリックスを操作するよりもはるかに高速です。しかし、行列は、空間データ スロットのないラスターとほぼ同等であると常に考えてきましたが、これらのデータ構造の重要な違いを見落としているに違いありません。このメモリの不均衡を説明できる理由を明確にしてくれてありがとう。私はマトリックス ワークフローをかなり使用しており、その制限を理解する必要があります。
編集:str()
レポートのリクエストを予想して:
> str(region_mat)
num [1:7297, 1:7297] NA NA NA NA NA NA NA NA NA NA ...
> summary(as.vector(region_mat))
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
-1.7 21.3 118.1 135.5 236.9 1020.0 1266438
> str(region_utm)
Formal class 'RasterLayer' [package "raster"] with 12 slots
..@ file :Formal class '.RasterFile' [package "raster"] with 13 slots
.. .. ..@ name : chr "/private/var/folders/kh/vlbqbp3n29lcvp491zbrnpl80000gn/T/R_raster_robinedwards/raster_tmp_2014-02-09_164243_1484_10601.grd"
.. .. ..@ datanotation: chr "FLT8S"
.. .. ..@ byteorder : Named chr "little"
.. .. .. ..- attr(*, "names")= chr "value"
.. .. ..@ nodatavalue : num -1.7e+308
.. .. ..@ NAchanged : logi FALSE
.. .. ..@ nbands : int 1
.. .. ..@ bandorder : Named chr "BIL"
.. .. .. ..- attr(*, "names")= chr "value"
.. .. ..@ offset : int 0
.. .. ..@ toptobottom : logi TRUE
.. .. ..@ blockrows : int 0
.. .. ..@ blockcols : int 0
.. .. ..@ driver : chr "raster"
.. .. ..@ open : logi FALSE
..@ data :Formal class '.SingleLayerData' [package "raster"] with 13 slots
.. .. ..@ values : logi(0)
.. .. ..@ offset : num 0
.. .. ..@ gain : num 1
.. .. ..@ inmemory : logi FALSE
.. .. ..@ fromdisk : logi TRUE
.. .. ..@ isfactor : logi FALSE
.. .. ..@ attributes: list()
.. .. ..@ haveminmax: logi TRUE
.. .. ..@ min : num -1.73
.. .. ..@ max : num 1020
.. .. ..@ band : int 1
.. .. ..@ unit : chr ""
.. .. ..@ names : chr "layer"
..@ legend :Formal class '.RasterLegend' [package "raster"] with 5 slots
.. .. ..@ type : chr(0)
.. .. ..@ values : logi(0)
.. .. ..@ color : logi(0)
.. .. ..@ names : logi(0)
.. .. ..@ colortable: logi(0)
..@ title : chr(0)
..@ extent :Formal class 'Extent' [package "raster"] with 4 slots
.. .. ..@ xmin: num 180386
.. .. ..@ xmax: num 394918
.. .. ..@ ymin: num 1879673
.. .. ..@ ymax: num 2103691
..@ rotated : logi FALSE
..@ rotation:Formal class '.Rotation' [package "raster"] with 2 slots
.. .. ..@ geotrans: num(0)
.. .. ..@ transfun:function ()
..@ ncols : int 7297
..@ nrows : int 7297
..@ crs :Formal class 'CRS' [package "sp"] with 1 slots
.. .. ..@ projargs: chr "+proj=utm +zone=16 ellps=WGS84 +ellps=WGS84"
..@ history : list()
..@ z : list()