問題タブ [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PubMed データを Kafka にプッシュする
PubMed データ ソースでは、出力を Kafka キューにプッシュする必要があります。各ソースは Kafka トピックとして表示できます。(私は Kafka の概念を知っており、Python を使用して Kafka を探索しました)
FireFTP を介して PubMed データを表示できます。
誰でも前進する方法を助けることができますか?
xml - XMLファイルで異なる名前のサブノード(子)の値にアクセスするには?
xmlValue
NCBI xml ファイルから特定の子ノードを解析しようとしています。ただし、一部の PM.ID については、公開されたレコードとRoot node <PubmedArticleSet>
は異なる情報を持っています。条件を渡し、特定の値を抽出して他の値を抽出したいと思います。最後に、PMID に対応する両方の値を使用して を作成します。簡単に思えますが、エラーがスローされますPubmedBookArticle
PubmedArticle
if(xmlName(fetch.pubmed) == PubmedBookArticle
elseif (xmlName(fetch.pubmed) == PubmedArticle
dataframe
(xmlName(fetch.pubmed)
no applicable method for 'xmlName' applied to an object of class "c('XMLInternalDocument', 'XMLAbstractDocument')"
私のコードは以下です
各検索で条件が満たされたときに PubmedArticle と PubmedBookArticle 内の値を取得できるように、上記のコードをループで取得するにはどうすればよいですか?
ncbi - 公開データ ncbi からすべての要約データをダウンロードするにはどうすればよいですか?
公開されているすべてのデータ アブストラクトをダウンロードしたいと考えています。公開された記事の要約をすべて簡単にダウンロードする方法を知っている人はいますか?
データのソースを入手しました: ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/af/12/
とにかく、これらすべての tar ファイルをダウンロードする方法はありますか..
前もって感謝します。
python - Pubmed eutils esearch の並べ替えオプション?
私は BioPython を使用して、eutils API を介して Pubmed データベースにクエリを実行しています。エンドポイントにはesearch
並べ替えオプションがありますが、API ドキュメントには、この値のすべてのオプションがリストされているわけではありません。
http://www.ncbi.nlm.nih.gov/books/NBK25499/#_chapter4_ESearch_
呼び出しの例:
私が知っている値は次のとおりですsort_method
。
- 「パブデート」
- 「関連性」
- 「最初の著者」
- 「最後の著者」
- '題名'
- 'ジャーナル'
ただし、「最新」であるデフォルトの並べ替え順序を指定する方法がわかりません。実際には、これは Pubmed ID 値でソートされているように見えます。「recent」、「most recent」、「pmid」、「id」、および「default」はすべて、OutputMessage に「不明なソート スキーマ....」を返します。
デフォルトの順序を明示的に指定する方法を知っている人はいますか?
api - Open Access ジャーナルから API/OAI/FTP 経由で出版キーワードを取得するにはどうすればよいですか? PubMed、DOAJ、またはその他のプラットフォームはありますか?
DOAJ.orgまたはPMC オープン アクセス サブセットのすべての出版物について、「著者リストのキーワード」を取得するための既知の API または方法はありますか?
PMC オープン アクセス サブセットの ftp を試してみましたが、XML ファイルには記事のメタデータとして ID、アブストラクト、タイトル、著者、所属しかありません。各出版物にリストされているキーワードも大量に取得しようとしています。
また、同じようなスレッドはほとんど見られませんでしたが、探していた答えはまだ見つかりませんでした。ということで、新たに投稿しました。
どんな助けでも大歓迎です。
ありがとう、
アスミ
python - efetch (Biopython、Entrez) から要約を抽出するにはどうすればよいですか?
私は python が初めてで、bio パッケージの entrez システムを使用して pubmed から要約を抽出したいと考えています。私は自分の UID (に保存されているmy_list_ges
) を esearch から取得しました。また、efetch を使用してエントリをダウンロードすることもできます。ただし、結果は辞書のリストになり、エントリは辞書のように見えますが、アクセスできません。
結果は TypeError です:
そして、最初のレコードからKeyError
取得しようとすると、次のようになります。'Abstract'
esearch の結果、辞書で自分の UID に簡単にアクセスできたので、これは奇妙です。
レコード [0] の構造は次のとおりです。
database - 著者名曖昧性解消データ
著者名の曖昧さ回避問題について研究しています。私はいくつかの実験をしたいです。引用レコードをクラスター化したい。各出版レコードの真の著者が利用できるトレーニング データとテスト データが必要です。DBLP、Medline、Pubmed などの多くの書誌データベースがあります。テスト段階について混乱しています。DBLP をトレーニングとテストに分割することは良い方法ですか? DBLP 引用レコードは手動で追加されますか? DBLP で各引用レコードが真の著者に割り当てられていることを保証できますか? データベースのトレーニングとテストに関する提案はありますか。注: 文献では、一部の論文ではトレーニングに Pubmed を使用し、テストに DBLP を使用していることに気付きましたが、最初のものは医学出版物用で、2 つ目はコンピューター用です。