Windows 7 で SQL Server 2008 と RGui (64 ビット) を使用しています。RODBC を使用して R から SQL Server に接続し、変数でデータセットを取得できます。理想的には、結果セットから特定の割合のレコード セット (10% など) または固定数 (25 など) を直接サンプリングしたいと考えています。
その場しのぎの解決策として、レコード セットをファイルにダンプし、そこからサンプリングしています。
結果セットから直接サンプリングする方法を教えてください。
これまでのコード:
> library (RODBC)
> conn <- odbcConnect ("TestR", "<username>")
> rs <- sqlQuery ("select Col1 from MyTable")
> sampleDocs <- sample (rs, size = 25, replace = TRUE, prob = NULL)
> set.seed(100)
> write.table(rs, file="C:\\FromTable.txt", row.names=FALSE, col.names=FALSE)
> docs <- read.table ("C:\\FromTable.txt")
> sampleDocs <- sample(docs$V1, size=101, replace=FALSE, prob=NULL)
> write.table(sampleDocs, file=\"C:\\\\SampleDocs.txt\", row.names=FALSE,
col.names=FALSE)