1

Biopython を使用して、データベースの更新ステータスを確認する方法はありますか?

私はこのようなことをしようとしています;

  1. 私は100000の医学用語のリストを持っています

  2. 7 月 1 日に、100000 語すべての ID リストを取得しました。

  3. 今日 (7 月 3 日)、100000 用語のいずれかに新しい記事が追加されたかどうかを知りたいです。

それを行う 1 つの方法は、以下のようにプロセス全体を繰り返すことです (100000 語すべてを取得)。

'termlist' = ['Malaria', 'Flu' ,...........]

for term in termlist:
    handle = Entrez.esearch(db = "pubmed", term = 'Malaria')
    record = Entrez.read(handle)
    record['Count']

今日のpubmedで更新された用語だけを見つける方法はありますか?

そして、自分の用語がその更新されたリストの一部である場合、100000 の用語すべてではなく、更新された用語を検索するだけで済みます。

4

1 に答える 1

1

ここには、esearch に関連するすべてのパラメーターがあります。

http://www.ncbi.nlm.nih.gov/books/NBK25499/#chapter4.ESearch

あなたが興味を持っているもの: reldate、datetype、mindate、および maxdate。これらのパラメーターを esearch コマンドに渡すと、Biopython は単にそれらを NCBI クエリにプラグインします。

# Retrieve the entries of the last 3 days
handle = Entrez.esearch(db = "pubmed", term = 'Malaria',
                        datetype = "edat", reldate = 3)

# Retrieve the entries between two dates:
handle = Entrez.esearch(db = "pubmed", term = 'Malaria',
                        mindate = "2014/07/03", maxdate = "2014/07/01")

また、次の構文を使用して用語を結合することで、クエリ プロセスを高速化できます。

term = "Malaria+OR+Cancer+OR+Anopheles"
于 2014-07-03T17:42:01.530 に答える