r - Rでビッグデータを作成するためのデータ構造

翻译自：https://stackoverflow.com/questions/17169006 2013-06-18T12:34:27.117

428 次

R で遺伝子レベルの分析スクリプトを作成していて、大量のデータを処理する必要があります。

私の最初のアイデアは、リスト内のリストのセットであるスーパーリスト構造を作成することでした。基本的にその構造は

#12.8 mins
list[[1:8]][[1:1000]][[1:6]][[1:1000]]

これは巨大で、データ構造をセットアップするだけで 12 分以上かかります。このプロセスを並べると、1:8 リストの 1 つの値を設定するときに約 1.6 分に短縮できるので、基本的には...

#1.6 mins
list[[1:1]][[1:1000]][[1:6]][[1:1000]]

通常、必要に応じてその場で構造を作成しますが、1:1000 のステップを配布しているため、どの順序で戻ってくるかわかりません。

このレベルのデータの作成を処理するための他のパッケージはありますか? 私のアプローチでより効率的なデータ構造を使用できますか?

これが完全に間違ったアプローチのように思えたら申し訳ありませんが、R でビッグデータを扱うのはこれが初めてです。

2 に答える 2