2

私が行っているシステマティック文献レビューの次のプロセスを自動化することに興味があります。

私は病気を引き起こす病原体のかなりのリストを持っており、医学文献でバッチ検索を実行し、各タイプのバグから得た結果を返したいと思っています。次に、これらを適切な CSV ファイルに入れて、R に読み込めるようにします。いくつかの統計/度数分布などをクランチします。

Excel シートと CTRL C + CTRL V を使用してこれをすべて実行できますが、時間がかかります。

基本的に、検索したいデータベースをホストしているOvidSPと対話する方法が必要です。次に、実行したい正確な検索のために正しくフォーマットされた文字列を入力します。次に、OvidSP に検索を実行させ、ヒット数を返します。利用可能な API があれば、これは簡単だと思います。これについて直接メールで問い合わせました。

これが可能であると誰かが考えたのか、それともこのタスクのスクリプトをプログラムする最良の方法は何だろうと思いました。Java、C++ の経験があり、R の学習を開始しました。Python が役立つかどうかも疑問に思いました。

これは私が達成したいことの簡単な例です

検索したいバグ (たとえば、CSV ファイル経由でプログラムに入力)
* サルモネラ
* 大腸菌
* インフルエンザ

私の資格情報で Ovid に接続し、次の検索を実行する特別なプログラムをここに挿入します

1 - サルモネラ AND 発熱 AND 病院 - 9342 件の結果を返す
2 - 大腸菌 AND 発熱 AND 病院 - 93821 件の結果を返す
3 - インフルエンザ AND 発熱 AND 病院 - 323 件の結果を返す

プログラムは、このデータをいくつかの統計に使用できる適切にフォーマットされた CSV ファイルに書き込みます

それが理にかなっていることを願っています!前もって感謝します。

4

1 に答える 1

0

原則として実行可能です。大きな問題は、返されるデータの解析 (難しい可能性があり、簡単な可能性があります) と認証 (おそらく難しいことではありませんが、サイトの構造によって異なります) です。

調べたい python モジュールは、urllib2 (リクエスト用)、csv (csv 用)、およびbeautifulSoupです。

これを Python で書くことの良いところは、返された html を (python シェルで) インタラクティブに調べることができるため、返される html から少量の興味深いデータを抽出する方法を簡単に理解できることです。

于 2012-06-20T18:36:23.207 に答える