問題タブ [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xlrd - biopython を使用して pubmed で検索する
著者が発行した記事の数を記録し、メンターと機関を含めて検索を絞り込むために、200 を超えるエントリを pubmed に入力しようとしています。biopython と xlrd を使用してこれを実行しようとしました (コードは以下にあります) が、3 つの形式の問い合わせ (1. 名前で、2. 名前と機関名で、3. 名前と名前で) のすべてで一貫して 0 の結果を得ています。メンターの名前)。以下に示すキーワードを使用して pubmed を検索するときに、別の形式を使用する必要がありますか?
入力クエリの出力例。search_term は、入力クエリのリストを含むリンク リストです。
上記の入力クエリを生成し、Pubmed で検索するために使用されるコード:
r - for ループからのデータをデータ フレームに格納する
pubmed API とやり取りして 100 の出版物に関連付けられた xml ファイルを取得する関数を作成しようとしています。次に、xml ファイルを個別に解析して、各出版物のタイトルと各出版物の要約を取得します。Rentrez パッケージを使用して API と対話し、必要な xml ファイルを正常に取得しました。私は xml パッケージを使用して xml ファイルを解析しており、Xpath 式が必要なデータを取得することを確認しています。実際には、他のフィールド (ジャーナル タイトル、メッシュ用語など) からデータを取得しようとしていますが、ここのこのステップで行き詰っています)
ただし、このデータをデータ フレームに移動するための適切な for ループを作成できませんでした。コードを実行すると、次のエラーが表示されます。
error in $<-.data.frame
( *tmp*
, "Abstract", value = list("text of abstract"): 置換は 1 行、データは 0
タイトル情報を取得する関数をテストすると (抽象的な情報を取得する式を削除して)、必要なタイトルに関する情報が含まれていない空のデータ フレームが返されます。しかし、エラーメッセージはありません。
pubmed_parsed("Kandel+Eric", n=2) を実行すると、私の目標は、「ATitle」列の 2 つのタイトルからの文字ベクトルを含むデータ フレームを受け取ることです (タイトル:「レトロトランスポゾンのサイレンシングにおける小さなノンコーディング RNA の役割」哺乳類の脳内」および「ApCPEBのホモログを含む非プリオンドメインであるApCPEB4は、長期的な促進の開始に関与しています」)。そして、2 つのアブストラクトからの文字ベクトルは、「アブストラクト」列に対応して表示されます (アブストラクトの一部:「Piwi 相互作用 RNA (piRNA)、長い間グレムリンに限定されると考えられていました...」、「2 つの薬理学的に異なるタイプのローカルタンパク質合成は、シナプス特異的に必要とされる...")。
php - curl の結果を simpleXML として解析し、それらを使用して新しい XML データを作成する
PubMed から XML としてデータを取得し、curl を使用してそれらの結果を処理し、それを別のページに SimpleXML としてロードしています。これにより、必要な情報 (pub ID のリスト) を取得し、それを別の pubmed スクレイプの変数として使用できます。これは、特定のパブ ID の概要を取得します。これが私の最初のファイルです ($name は最終的に動的になります):
(とりわけ) Pub ID のリストを含む XML データをエクスポートします。
次に、それを別のページにロードして、SimpleXML を使用して Pub ID を変数に変換できるようにします。そして、その変数を使用して、別の curl/pubmed リクエストを試みます。これは、それらの ID に基づいて要約を取得します。
これを個々の引用としてエクスポートすることはできますが、私の問題は、著者などの特定のものをフォーマットして無関係なデータを除外できるように、その 2 番目のデータ セットを取得できる必要があることです。
これが ONE の結果からの XML です。
その 2 番目のデータ セットの項目を取得する方法がわかりません。ソースはまだ適切にフォーマットされていることを示していますが、「オブジェクト以外のプロパティを取得しようとしています」というエラーが引き続き発生します。
これらの結果をさらに別のファイルに送信し、SimpleXML を使用して制御することを検討しましたが、最初のファイルを解析して同じページに別のカールを追加しているため、ヘッダーを追加すると気に入らないようです。
どんな助けでも大歓迎です!
更新:正しい方向に向けてくれた @EatPeanutButter に感謝します。$cxml=simplexml_load_string($result);
の代わりに
使用
する$Cxml = new SimpleXMLElement($result);
ことで、必要なデータを取得できるだけでなく、次のようにカールを単一のページに結合することもできました。
そしてもちろん、これにより新しい問題が作成され、フォローアップの質問として投稿する予定です!
php - PubMed クエリから curl の結果を解析し、それらを引用にフォーマットする
これは、この質問のフォローアップの質問です。
同じ考え: PubMed からデータを XML として取得し、curl を使用してそれらの結果を処理しています。これにより、必要な情報 (パブ ID のリスト) を取得し、それを別の PubMed スクレイプの変数として使用できます。$name は最終的に動的になります。
次の XML データを返します (これは 1 つの結果です)。
このように反響します:
2016 年 10 月 Bhattacharya S.、Sobel JD.、White TC.、Azole-Resistant Vaginal Candida albicans Isolates における抵抗メカニズムとしての組み合わせ蛍光アッセイによる排出ポンプ活性の増加。Vol.60、Issue10。ジャーナル記事、抗菌剤と化学療法。
Zavrel M.、White TC.、医学的に重要な真菌はアゾール薬に反応します: 最新情報。Vol.10、Issue8。ジャーナル記事、総説、未来の微生物学。
Esquivel BD.、Smith AR.、Zavrel M.、White TC.、病原菌アスペルギルス フミガタスへのアゾール薬の輸入。Vol.59、Issue6。ジャーナル記事、抗菌剤と化学療法。
2015 年 4 月 Achterman RR.、Moyes DL.、Thavaraj S.、Smith AR.、Blair KM.、White TC.、Naglik JR.、Dermatophytes は、マイトジェン活性化プロテインキナーゼ シグナル伝達を介して皮膚ケラチノ サイトを活性化し、免疫応答を誘導します。Vol.83、Issue4。ジャーナル記事、感染と免疫。
2015 年 2 月 3 日。Ford CB.、Funt JM.、Abbey D.、Issi L.、Guiducci C.、Martinez DA.、Delorey T.、Li BY.、White TC.、Cuomo C.、Rao RP.、Berman J .、Thompson DA.、Regev A.、Candida albicans の臨床分離株における薬剤耐性の進化。Vol.4、発行。ジャーナル記事、eLife。
2014 年 8 月 1 日。White TC.、Findley K.、Dawson TL Jr.、Scheynius A.、Boekhout T.、Cuomo CA.、Xu J.、Saunders CW.、皮膚の真菌: 皮膚糸状菌およびマラセチア。Vol.4、Issue8。ジャーナル記事、レビュー、医学におけるコールド スプリング ハーバーの展望。
2014 年 1 月 Maguire SL.、Wang C.、Holland LM.、Brunel F.、Neuvéglise C.、Nicaud JM.、Zavrel M.、White TC.、Wolfe KH.、Butler G.、Zinc finger 転写因子が SREBP タンパク質を置換Saccharomycotina 進化中の主要なステロール調節因子として。Vol.10、Issue1。ジャーナル記事、PLoS 遺伝学。
2013 年 11 月 15 日。Campoli P.、Perlin DS.、Kristof AS.、White TC.、Filler SG.、Sheppard DC.、上皮細胞および真菌内のポサコナゾールの薬物動態: 治療および予防中の潜在的な作用機序への洞察。Vol.208、Issue10。ジャーナル記事、感染症ジャーナル。
2013 年 7 月 8 日。Achterman RR.、White TC.、Dermatophytes。Vol.23、Issue13。ジャーナル記事、現在の生物学: CB.
等。
それはすべてうまく機能し、必要なデータのみで引用を生成しますが、結果を並べ替えることができないため、著者が最初に来て、PubDate が最後に来るなどです。それをクラックすることはできません。
XSLT スタイル シートを添付しようとしましたが、実際には XML ファイルを出力していないため、機能していないと思います。多分?
一番下の SimpleXML ブロックの代わりに次の XPath を使用して引用を返してみましたが、空白の結果が得られ続けます。すべてのデータが としてタグ付けされ<Item>
ているため、Name 属性を使用しようとして失敗しました。
DOMXPath と GetElementsByTagName も試してみましたが、役に立ちませんでした。
基本的に、私は立ち往生しています。私はそれぞれのバリエーションを非常に多く試しましたが、非常に多くのエラーが発生し、円を描いているように感じました. Xpath または XSLT の経験が豊富な方にアイデアはありますか?