“pubmed”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

656 参照

r - R でのテキスト検索

RISmed という名前の R パッケージで使用するクエリを作成しようとしています。これは、pubmed データベースから関連するジャーナル記事情報を検索してダウンロードします。たとえば、常に2つの単語を一緒に検索したい：

上記のコマンドを使用すると、遺伝子とシーケンスが別々に検索され、次に遺伝子とシーケンスの両方が検索されます。つまり、テキスト全体に遺伝子とシーケンスが存在する場合、コマンドはそれらをキャプチャしますが、考慮されるような方法で検索したい「遺伝子配列決定」、2 つの単語は常に一緒です。そのクエリをどのように書くことができますか? 誰か助けてくれませんか？

前もって感謝します！

r text mining pubmed

2015-03-22T20:11:07.400

0 投票する

1 に答える

266 参照

php - PHP: Entrez データベース (Pubmed) からメッシュタームを返す速度を改善

Pubmed データベースの検索結果から Mesh 用語を抽出したいと考えています。私はphpを使用しています。

動作するスクリプトを作成しましたが、非常に遅いです。各記事を開き、XML を解析してメッシュタームを取得します。「fopen」関数は遅い部分です。

このスクリプトは、記事ごとに大きな xml ファイルを開きます: http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=19616537&retmode=xml

Mesh 用語のみ、または少なくとも xml の一部を取得する方法はありますか? それとも、ファイルの半分だけをロードしますか?

ありがとうございました

更新：私はいくつかの改善を得ました。とefetch を使用するretmode=textとrettype=medline、1 つのファイルのダウンロードが 15 kb から 4kb に減少しました。また、リクエストの量を減らすために、すべてのダウンロードをバンドルしました。

500 件の結果を読み込むのに 4.8 秒かかります。

それでも早くしたい。

誰にもいくつかのヒントがありますか？

php performance pubmed

2015-03-28T20:03:39.370

0 投票する

1 に答える

594 参照

python - Pythonを使用したBio Entrez pubmedプルの日付のフィルタリング/アクセス

公開された論文のリストを取得するための基準 (論文が公開されたときの名前と日付範囲) のリストがあります。私は Biopython の Bio Entrez を使用して、Entrez から論文を取得しています。

著者名でクエリを実行して結果を取得できますが、データを処理して日付を取得する方法がわかりません。これは私がやったことです：

出力は次のようになります

私が理解していることから常にxml出力があるとは限らないEfetchの使用を調べてみました。xmlを解析することで日付をフィルタリングできると思った

次のエラーが表示されます: Traceback (most recent call last):

何かが足りない気がするので、これをクエリに直接入力できるはずです。また、これを行うのが難しい方法のように見えるにもかかわらず、この方法が機能しない理由もわかりません。これを行うより良い方法はありますか？xml.etree を使用してこれを実行しようとしましたが、同様のエラーも発生しました。

python text pubmed

2015-06-01T17:48:33.977

0 投票する

1 に答える

1154 参照

xml - XML のネストされた属性要素を XSLT 変換して名前を連結する方法

私は XML/XSLT にまったく精通していません。私は、この XML ファイルを自分の Access データベースで使用できるものに変換するのに十分なだけ学習しようとしています。XML データは属性形式で出力され、Access は要素形式のみを好みます。基本的な変換は完了しましたが、ネストされたデータを要素化できないようです。

最終結果をすべての要素にしたいと思います。現時点では、私の XSLT スクリプトは子要素の名前に親の名前属性を含めようとしていますが、それは必要ないかもしれません。リストの要素に番号を付けて名前を付けることができれば最高です。「AuthorList1」、「AuthorList2」または「Author1」、「Author2」など。

私が扱っているXMLの種類は次のとおりです（省略）：

XML

私は XSLT についてかなり理解を深めてきましたが、まだそこまで到達したわけではありません。発生し続ける問題の 1 つは、空の要素 (参照など) が許可されていない null 名を取得することです。これは、"Item[@Type='List']" の一致パターンを使用してコマンドを実行しようとしたときに発生しました。また、リストの子ノード (要素?) を独自の要素にすることができないようです。

XSLT

これが何らかの意味をなすことを願っています。XML 変換を再び扱うことになるとは思えないので、この分野の専門家になるつもりはまったくありません。今後のヘルプがあれば幸いです。

xml xslt transformation pubmed

2015-06-11T16:44:11.437

0 投票する

2 に答える

330 参照

python - XML の解析: ElementTree を使用した興味深い要素の検索

urllib と ElementTree を使用して、pubmed からの XML API 呼び出しを解析しています。

これの例は次のとおりです。

Element Tree を使用して、データを ET.fromstring からオブジェクトルートにインポートできるようになりました。私の問題は、このオブジェクトから興味深い要素を見つけるのに苦労していることです。

私は参照しています: https://docs.python.org/2/library/xml.etree.elementtree.html と私の XML 形式は次のようになります: http://eutils.ncbi.nlm.nih.gov/entrez/eutils /esummary.fcgi?db=pubmed&id=1757056

私が試してみました：

としても

python xml python-3.x xml-parsing pubmed

2015-08-25T14:17:29.243

問題タブ [pubmed]

r - R でのテキスト検索

php - PHP: Entrez データベース (Pubmed) からメッシュ タームを返す速度を改善

python - Pythonを使用したBio Entrez pubmedプルの日付のフィルタリング/アクセス

xml - XML のネストされた属性要素を XSLT 変換して名前を連結する方法

python - XML の解析: ElementTree を使用した興味深い要素の検索

Reference

php - PHP: Entrez データベース (Pubmed) からメッシュタームを返す速度を改善