1

PubMedで検索ワードとして著者情報や論文情報を収集しています。パッケージ内を使用entrez_fetchして、著者名、発行年、およびその他の情報を正常に取得しています。rentrez以下は私のコード例です:

library(rentrez)
library(XML)

pubmedSearch <- entrez_search("pubmed", term = "flexible ureteroscope", retmax = 100)
SearchResults <- entrez_fetch(db="pubmed", pubmedSearch$ids, rettype="xml", parsed=TRUE)
First_Name <- xpathSApply(SearchResults, "//Author", function(x) {xmlValue(x[["ForeName"]])})
Last_Name <- xpathSApply(SearchResults, "//Author", function(x) {xmlValue(x[["LastName"]])})
PubYear <- xpathSApply(SearchResults, "//PubDate", function(x) {xmlValue(x[["Year"]])})
PMID <- xpathSApply(SearchResults, "//ArticleIdList", function(x) {xmlValue(x[["ArticleId"]])})

必要なすべての情報を取得したにもかかわらず、どの著者がどの PMID に属しているかを判断するのに問題があります。これは、PMID ごとに著者の長さが異なるためです。たとえば、私のコードのように 100 件の記事の著者情報を解析すると、100 を超える著者名が取得され、それぞれの PMID に関連付けることができません。全体として、次のような出力データ フレームが必要です。

 PMID       First_Name   Last_Name          PubYear
 28221147   Carlos      Torrecilla Ortiz    2017
 28221147   Sergi       Colom Feixas        2017
 28208536   Dean G      Assimos             2017
 28203551   Chad M      Gridley             2017
 28203551   Bodo E      Knudsen             2017

このようにして、どの著者がどの PMID に関連付けられているかを知ることができ、さらなる分析に役立ちます。

念のため、これは私のコードの小さな例です。パッケージ内のXML解析を使用して、より多くの情報を収集しています。entrez_fetchrentrez

この問題は本当に私を悩ませており、助けや指導を本当に感謝しています. 事前にご協力いただきありがとうございます。

4

1 に答える 1