0

私はstackoverflowの新しいメンバーであり、Rで働き始めているので、助けが必要です!

タブで区切られた740行と500000列のファイルがあり、.txt形式です。ファイルのサイズは約1.2GBです。このファイルには、牛の遺伝子型に関する情報が含まれています。このファイルをRプログラムに読み込んで、表現型データとの関連解析を実行する必要があります。この大きなファイルをRにインポートできません。誰かがこれを行うコマンドを知っていますか?このファイルをインポートしてRで読み取るためのコマンドですか?

私のシステム:i5と6GbのRAMメモリ。

4

3 に答える 3

3

read.table() が必要です。ファイルにヘッダーはありますか?

Linux の場合 (ファイルにヘッダーなし): mydata = read.table("/home/username/genotype.txt", header=FALSE)

Linux の場合 (ファイルにヘッダーあり): mydata = read.table("/home/username/genotype.txt", header=TRUE)

Windows の場合 (ファイルにヘッダーなし): mydata = read.table("c:\\mydata\\genotype.txt", header=FALSE)

Windows の場合 (ファイルにヘッダーあり): mydata = read.table("c:\\mydata\\genotype.txt", header=TRUE)

read.table()はデフォルトで区切り文字としてタブを使用しますが、引数 sep="," (または sep="|" など) を指定して別の区切り文字を指定できます。

于 2012-12-07T20:24:10.053 に答える
1

他の回答は、データを R に読み込むという一般的な問題に対処しますが、データは特定の型です。CRANおよびBioconductorで利用できる優れた「ドメイン固有の」パッケージがいくつかあります。これらのパッケージには、このデータを入力する独自の方法があり、おそらく現在の表現から変換されますが、一般的な操作の効率的な処理とパフォーマンスに大きな利点がある可能性があります。R の一般的な機能を使用する方法を同時に学びながら、これらを追求することをお勧めします。

于 2012-12-07T21:12:07.343 に答える
1

R では、?read.csvand?read.tableと入力すると、これらの関数のヘルプ ファイルが表示されます。

次に、この関数の出力を変数に割り当てることができます。これがデータ フレームになります。

例えば:

  myDataFrame <- read.csv("path/to/file.txt", sep="\t")
于 2012-12-07T20:04:41.680 に答える