これは、ここでの使用に関する回答のフォローアップですsqldf()
https://stackoverflow.com/a/1820610
私の特定のケースでは、1 億 1000 万行を超えるタブ区切りファイルがあります。460 万のタグ ID に一致する行を選択したいと考えています。
次のコードでは、タグ ID はtag.query
ただし、この例は小さなクエリで機能しますが、上記の大きな例は処理しません。
sql.query <- paste('select * from f where v2 in (', tag.query, ')', sep='')
selected.df <- sqldf(sql.query, dbname = tempfile(), file.format = list(header = F, row.names = F, sep="\t", skip=line.where.header.is))
代替アプローチに関する提案はありますか?