問題タブ [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R でのテキスト検索
RISmed という名前の R パッケージで使用するクエリを作成しようとしています。これは、pubmed データベースから関連するジャーナル記事情報を検索してダウンロードします。たとえば、常に2つの単語を一緒に検索したい:
上記のコマンドを使用すると、遺伝子とシーケンスが別々に検索され、次に遺伝子とシーケンスの両方が検索されます。つまり、テキスト全体に遺伝子とシーケンスが存在する場合、コマンドはそれらをキャプチャしますが、考慮されるような方法で検索したい「遺伝子配列決定」、2 つの単語は常に一緒です。そのクエリをどのように書くことができますか? 誰か助けてくれませんか?
前もって感謝します !
php - PHP: Entrez データベース (Pubmed) からメッシュ タームを返す速度を改善
Pubmed データベースの検索結果から Mesh 用語を抽出したいと考えています。私はphpを使用しています。
動作するスクリプトを作成しましたが、非常に遅いです。各記事を開き、XML を解析してメッシュ タームを取得します。「fopen」関数は遅い部分です。
このスクリプトは、記事ごとに大きな xml ファイルを開きます: http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=19616537&retmode=xml
Mesh 用語のみ、または少なくとも xml の一部を取得する方法はありますか? それとも、ファイルの半分だけをロードしますか?
ありがとうございました
更新:私はいくつかの改善を得ました。とefetch を使用するretmode=text
とrettype=medline
、1 つのファイルのダウンロードが 15 kb から 4kb に減少しました。また、リクエストの量を減らすために、すべてのダウンロードをバンドルしました。
500 件の結果を読み込むのに 4.8 秒かかります。
それでも早くしたい。
誰にもいくつかのヒントがありますか?
python - Pythonを使用したBio Entrez pubmedプルの日付のフィルタリング/アクセス
公開された論文のリストを取得するための基準 (論文が公開されたときの名前と日付範囲) のリストがあります。私は Biopython の Bio Entrez を使用して、Entrez から論文を取得しています。
著者名でクエリを実行して結果を取得できますが、データを処理して日付を取得する方法がわかりません。これは私がやったことです:
出力は次のようになります
私が理解していることから常にxml出力があるとは限らないEfetchの使用を調べてみました。xmlを解析することで日付をフィルタリングできると思った
次のエラーが表示されます: Traceback (most recent call last):
何かが足りない気がするので、これをクエリに直接入力できるはずです。また、これを行うのが難しい方法のように見えるにもかかわらず、この方法が機能しない理由もわかりません。これを行うより良い方法はありますか?xml.etree を使用してこれを実行しようとしましたが、同様のエラーも発生しました。
xml - XML のネストされた属性要素を XSLT 変換して名前を連結する方法
私は XML/XSLT にまったく精通していません。私は、この XML ファイルを自分の Access データベースで使用できるものに変換するのに十分なだけ学習しようとしています。XML データは属性形式で出力され、Access は要素形式のみを好みます。基本的な変換は完了しましたが、ネストされたデータを要素化できないようです。
最終結果をすべての要素にしたいと思います。現時点では、私の XSLT スクリプトは子要素の名前に親の名前属性を含めようとしていますが、それは必要ないかもしれません。リストの要素に番号を付けて名前を付けることができれば最高です。「AuthorList1」、「AuthorList2」または「Author1」、「Author2」など。
私が扱っているXMLの種類は次のとおりです(省略):
XML
私は XSLT についてかなり理解を深めてきましたが、まだそこまで到達したわけではありません。発生し続ける問題の 1 つは、空の要素 (参照など) が許可されていない null 名を取得することです。これは、"Item[@Type='List']" の一致パターンを使用してコマンドを実行しようとしたときに発生しました。また、リストの子ノード (要素?) を独自の要素にすることができないようです。
XSLT
これが何らかの意味をなすことを願っています。XML 変換を再び扱うことになるとは思えないので、この分野の専門家になるつもりはまったくありません。今後のヘルプがあれば幸いです。
python - XML の解析: ElementTree を使用した興味深い要素の検索
urllib と ElementTree を使用して、pubmed からの XML API 呼び出しを解析しています。
これの例は次のとおりです。
Element Tree を使用して、データを ET.fromstring からオブジェクト ルートにインポートできるようになりました。私の問題は、このオブジェクトから興味深い要素を見つけるのに苦労していることです。
私は参照しています: https://docs.python.org/2/library/xml.etree.elementtree.html と私の XML 形式は次のようになります: http://eutils.ncbi.nlm.nih.gov/entrez/eutils /esummary.fcgi?db=pubmed&id=1757056
私が試してみました:
としても