2

RISmed という名前の R パッケージで使用するクエリを作成しようとしています。これは、pubmed データベースから関連するジャーナル記事情報を検索してダウンロードします。たとえば、常に2つの単語を一緒に検索したい:

query= "gene sequencing"
search<-EUtilsSummary(query,type="esearch",db = "pubmed",mindate=2014, maxdate=2014, retmax=20)

上記のコマンドを使用すると、遺伝子とシーケンスが別々に検索され、次に遺伝子とシーケンスの両方が検索されます。つまり、テキスト全体に遺伝子とシーケンスが存在する場合、コマンドはそれらをキャプチャしますが、考慮されるような方法で検索したい「遺伝子配列決定」、2 つの単語は常に一緒です。そのクエリをどのように書くことができますか? 誰か助けてくれませんか?

前もって感謝します !

4

1 に答える 1

1

私はこれを試してみます:

query <- '"gene sequencing"[Title/Abstract]'

pubmed 検索エンジンは引用符で囲まれた文字列を受け入れますが、R 内でそれらを保持する方法を知っている必要があります。単一引用符で囲むのも 1 つの方法です。バックスラッシュ付きの引用符を使用するのは別の方法です。あなたのコードでの私の実験からの戻り値は、エスケープバックスラッシュがそのパッケージの実装者がそれを行う方法であることを示していることに注意してください:

> str(search)
Formal class 'EUtilsSummary' [package "RISmed"] with 6 slots
  ..@ db              : chr "pubmed"
  ..@ count           : num 542
  ..@ retmax          : num 20
  ..@ retstart        : num 0
  ..@ PMID            : chr [1:20] "25548628" "25543043" "25542841" "25540641" ...
  ..@ querytranslation: chr "\"gene sequencing\"[Title/Abstract] AND 2014[EDAT] : 2014[EDAT]"
于 2015-03-22T20:41:32.893 に答える