特定のフィールドプロパティを持つテーブル内のすべての行を選択したいと思います。つまり、フィールドは既知の10万個の文字列の1つです。
Rを使用してクエリを送信しています。だから私は次のようなコードを持っています:
my_samp <- sample(unique_ids, replace=T, size=10^6)
my_conn <- dbConnect(MySQL(),user='me',dbname='my_db')
query <- paste('SELECT blah1, blah2,...,blah900 FROM my_table WHERE blah1=',paste(my_samp,collapse=' OR ',sep=''),sep='')
res1 <- dbSendQuery(my_conn, query)
my_data <- fetch(res1,n=-1)
dbDisconnect(my_conn)
ただし、Rインタープリターまたはmysqlのいずれかによって文字列が正しく処理されないのではないかと心配しています。また、これは非効率的だと思います。よりクリーンな解決策はありますか?
テーブルが大きすぎるため、dbReadTableを使用してテーブル全体をRに直接読み取ることはできません。
私は、プロセスをフォークすることによってこれを数千回行うことを計画しています-統計的ブートストラップ。
my_sampで文字列が繰り返される場合は、クエリに重複するレコードが必要です。