4

R のrentrezパッケージを使用して PubMed を検索しており、関連性で並べ替えられた結果を取得したいと考えています。現在、発行日順に並んでいます。

library(rentrez)

query = 'regression to the mean[TITL]'
entrez_search = entrez_search(db="pubmed", term=query, retmax=30)
paper_data = entrez_summary(db="pubmed", id=entrez_search$ids)
dates = extract_from_esummary(paper_data, c("pubdate"))
4

2 に答える 2

3

私が理解しているように、「関連性」情報は特定の検索に関連付けられており(後でダウンロードされる可能性のあるレコードの要約や完全なレコードではありません)、特定の検索結果が返されたデータにどの程度関連しているかを示すスコアなどはありませんエントレズ検索で。

一方、sort=relevance議論は何かをしていると思います。同じ検索を 2 回送信すると、ID は同じ順序になります。

default_search = entrez_search(db="pubmed", term=query, retmax=30)
default_search_again = entrez_search(db="pubmed", term=query, retmax=30)
all(default_search$ids == default_search_again$ids)

.

[1] TRUE

順序をrelevance変更するように設定すると、次のようになります。

rel_search = entrez_search(db="pubmed", term=query, retmax=30, sort="relevance")
default_search$ids == rel_search$ids

.

 [1]  TRUE  TRUE  TRUE  TRUE FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE  TRUE  TRUE  TRUE  TRUE
[25] FALSE FALSE  TRUE  TRUE FALSE FALSE

サマリー、フェッチ、およびリンク関数へのその後の呼び出しは、この順序を維持する必要があるため、これが関連情報を追跡する最も簡単な (唯一の?) 方法でしょうか?

于 2016-08-01T03:28:10.620 に答える
1

extract_from_esummarypaper_dataesummary で使用され、選択された引数を呼び出しています。あなたの場合、それはpubdateです。

paper_dataたとえば、 then を使用して の構造を調べるstr(paper_data)と、 の 2 番目の引数として使用できる要素に気付くでしょうextract_from_esummary。たとえば、ISSN で並べ替えます。

issn <- extract_from_esummary(paper_data, c("issn"))

残念ながら、関連性に似たものは何も見つかりません。

于 2016-07-04T10:57:02.320 に答える