問題タブ [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pubmed をクエリする biopython コードの例を含む HTTPError
Python を介して pubmed にクエリを実行したい。これを行うための素敵な生物学関連のライブラリを見つけました: http://biopython.org/DIST/docs/tutorial/Tutorial.html
ここでサンプルコードを見つけました: http://biopython.org/DIST/docs/tutorial/Tutorial.html#htoc116
メールを変更してこのコードを実行すると、次のエラーが表示されます。
問題の原因を突き止める手掛かりはあまりありません。アクセスしようとしている URL がわかりません。「pubmed entrez urllib2.HTTPError: HTTP Error 404: Not Found」を検索すると、8 つの結果が得られますが、関連するものはありません (このスレッドを除く)。
bioinformatics - pmid 2 pmcid の Pubmed entrez ツールで奇妙な結果が得られるのはなぜですか?
この API を使用して、PMid から PMCid への変換を含む Ruby スクリプトの rspec を作成していました。
このように呼び出すとうまくいきます:
しかし、私は仕様を書いていて、誰かが数字の代わりに文字列を渡したときのように、失敗した呼び出しが必要でした。だから私はこれを試しました:
これは 599027 個の PMCid を返します!
リバースサービスを確認しました:
Ant呼び出し:
問題ないようです。
これが PMid to PMCid サービスの正しい (および文書化された) 動作であるかどうかは誰にもわかりませんか?
興味深いことに、'foobar' によって返された PMCid の一部を逆検索すると、それらはすべて、一致する PMid がゼロであることが示されています。
lucene - plucene::simpleを使用してすべてのフィールドにインデックスを付けないでください
私は大量のデータを保存するためのpluceneを探していますが、これは非常に新しいものです。データの各レコードには、一意のIDとさらに3つのフィールドがあります。フィールドにはたくさんのテキストがありますが、IDだけを検索/インデックス付けできるようにしたいので、IDを指定すると他のフィールドを取得できます。簡単なコード例は次のとおりです。
私はplucene::simpleを使おうとしていますが、2つの質問/問題があります:
- 一部のフィールドにインデックスを付けないオプションが表示されません。
@results
配列で取得し'id1'
ます。どうすれば抽象フィールドなどを取り戻すことができますか?
前もって感謝します
xml - Perl: XML 出力 (Eutils 経由の PubMed UID) から配列を生成します
PubMed の Eutils によって生成された XML 出力から ID の配列を作成しようとしています。
GitHub のコードは次のとおりです。以下は、特定のサブルーチンです。
これについて最善の方法は何ですか?
PubMed XML の結果は次のようになります。
java - Entrez Utilities Web Service を使用した公開済み抄録へのアクセス
Entrez Utilities Web Service ライブラリを使用して、Java アプリケーションから公開記事にアクセスします (pubmed 識別子を使用)。このツールの完全な使用例は、Renaudによってgithubのこの投稿で公開されています。ほとんどの場合、すべて正常に動作しますが、最近、ライブラリをクラッシュさせる pubmed id を見つけました。
私が使用するコードは次のようになります。
この関数を呼び出すと、id = 22363258
まったく有益ではないエラーが表示されます。
だから、私は2つの質問があります:
- 理由は何ですか?修正するにはどうすればよいですか?
- 公開された抄録にアクセスするために使用できる他の Java API はありますか? HTMLページを解析できることは知っていますが、解決するよりも多くの問題を引き起こすため、本当にやりたくありません...
java - Java PubMed は URL リクエストをブロックします
PubMed の記事にアクセスし、各 XML からの情報を解析するコードがいくつかあります。プログラムは私のコンピューターでは正常に動作しますが、完了するまでに多くの時間が必要です。したがって、特にこの種のことのためにUNIXマシンで実行すると、私が行うすべてのリクエストがブロックされます。マシンがウイルスと見なす前に 1 分間に作成できる数には制限がありますが、すべての要求がブロックされるため、それは問題ではありません。確認したところ、これは PubMed サイトでのリクエストでのみ発生します。
前もって感謝します
編集:接続には jsoup を使用します。私のプログラムから ProcessBuilder を使用して wget を実行すると、ブロックされることなく動作しますが、wget からの出力はのみで読み取ることができwhile(br.readline() != null)
、この広告には多くの実行時間がかかるため、効率が問題になります。
python - 公開された記事から完全な要約を取得する biopython の方法はありますか?
現在、pubmed をクエリする次のコードがあります。
このコードは、記事に要約があるかどうかを教えてくれますが、実際に要約を返す方法に関するドキュメントは見つかりません。biopython を使用することは可能ですか? そうでない場合、別の方法はありますか?