さらに大きなテーブルから多数の行を抽出するための高速な方法を探しています。私のテーブルの一番上は次のとおりです。
> head(dbsnp)
snp gene distance
rs5 rs5 KRIT1 1
rs6 rs6 CYP51A1 1
rs7 rs7 LOC401387 1
rs8 rs8 CDK6 1
rs9 rs9 CDK6 1
rs10 rs10 CDK6 1
そして寸法:
> dim(dbsnp)
[1] 11934948 3
リストに行名が含まれている行を選択したい:
> head(features)
[1] "rs1367830" "rs5915027" "rs2060113" "rs1594503" "rs1116848" "rs1835693"
> length(features)
[1] 915635
当然のことながら、これを行う簡単な方法にはかなり長い時間temptable = dbsnp[features,]
がかかります。
私はRのsqldfパッケージを介してこれを行う方法を検討してきました。それはもっと速いかもしれないと思いました。残念ながら、SQLで特定の行名を持つ行を選択する方法がわかりません。
ありがとう。