0

「乳がん細胞株の時系列遺伝子発現プロファイル」に関する実験に関するすべてのエントリをGEOdbからダウンロードしようとしています。私はGEOqueryRパッケージを使用しており、送信するクエリは次のとおりです。

> sql <- paste("SELECT DISTINCT gse.title,gse.gse", "FROM", 
               " gsm JOIN gse_gsm ON gsm.gsm=gse_gsm.gsm", 
               " JOIN gse ON gse_gsm.gse=gse.gse", 
               " JOIN gse_gpl ON gse_gpl.gse=gse.gse", 
               " JOIN gpl ON gse_gpl.gpl=gpl.gpl", "WHERE", 
               " gsm.molecule_ch1 like '%total RNA%' AND", 
               " gse.title LIKE '%breast cancer cell lines time series gene expression profiles%' AND",  
               " gpl.organism LIKE '%Homo sapiens%'",  sep = " ")

>rs <- dbGetQuery(con, sql)

これで、出力は1データセットになります。乳がん細胞株で多くの時系列実験が行われていることは確かにわかっているので、それは少なすぎて間違っているようです。おそらく「タイトル」のSQLクエリを間違えていると思います。誰か助けてもらえますか?

4

1 に答える 1

1

クエリは部分文字列を探します breast cancer cell lines time series gene expression profiles。単語はこの順序で正確に表示される必要があり、間に何もありません。たとえば、分割を試みることができます(さらに分割する必要がある場合があります)。

    gse.title LIKE '%breast cancer cell lines%'
AND gse.title LIKE '%time series%'
AND gse.title LIKE '%gene expression profiles%'

一部のデータベースでLIKEは、大文字と小文字が区別されます。この場合、ILIKEが望ましい場合があります。

于 2012-07-04T03:54:31.583 に答える