2

更新: 回答のリンクは興味深く便利ですが、残念ながら Java API の必要性に対応していないため、引き続きご意見をお待ちしております。

化合物のデータベースを構築しています。すべての類義語 (IUPAC および一般名) とそれぞれの安全性データが必要です。
PubChem (http://pubchem.ncbi.nlm.nih.gov/) で自由に入手できるデータを使用します。

単純な HTTP get を使用して各化合物を照会する簡単な方法があります。たとえば、グリセロール データを取得する場合の URL は次のとおりです。

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753

次の URL は、解析しやすい形式を返します。

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF

しかし、それは非常に基本的な情報のみを応答し、安全性データといくつかの一般的な名前を欠いています.

Scripps のグループによって開発された、非常に完全な Java 用のパブリック ドメイン API が 1 つあります ( citation )。コードはこちらです。

残念ながら、この API は十分に文書化されておらず、関連するデータが複雑なため、理解するのが非常に困難です。私が収集したものでは、pubchemdb はPubChem Power User Gateway (PUG) XML APIを使用しています。

誰かがこの API (または他の利用可能なもの) を使用しましたか? それを始める方法についての簡単な説明またはチュートリアルをいただければ幸いです。

4

1 に答える 1

2

Cactvsケモインフォマティクスツールキット(学術/教育用は無料)には、PubChemが完全に統合されています。スクリプト環境を使用すると、次のようなことが簡単にできます。

cactvs> ens create 753

ens0

cactvs> ens get ens0 E_NAMESET

プロパン-1,2,3-トリオールグリセリン8043-29-629796-42-730049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {グリセロール、天然} NCGC00090950-03 191612_ALDRICH15524_RIEDEL{グリセロール溶液}L-グリセロール49767_FLUKA{バイオディーゼル不純物}49770_FLUKA49771_FLUK 0149927_FLUKAグリセロール-ゼラチンG7757_SIALGOLD-グリセロールG9012_SIAL{多価アルコール}c0066MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA{濃縮グリセリン}{濃縮グリセリン(JP15)} D00028 {Glycer JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {グリセリン、濃縮} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropan 1,23-トリヒドロキシプロパノールグリセリンG2289_SIALG9406_SIGMA{Glycerol- [2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI = 1 / C3H8O3 / c4-1-3(6)2-5 / h3-6H、1-2H{90テクニカルグリセリン} Dagralax {グリセリン、無水} {グリセリン、合成}グリセリングリセリトール{グリセリンアルコール}グリセリングリセリンNSC9230オフタルガンオスモグリンプロパントリオール{合成グリセリン}{合成グリセリン}トリヒドロキシプロパンビトロスポス{WLN:Q1YQ1Q} 00-02751(ベールスタインハンドブックリファレンス)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin、wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide化学コード063507}{FEMANo. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin(mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-ラテン語]}グロコレン{HSDB492}IFP{取り込み係数}1,2、3-プロパントリオールC00116Optim{プロパントリオール(VAN)} {1,2,3-プロパネトリオール、ホモポリマー}{グリセロールポリマー}{グリセロール、ポリマー} {HL 80} {PGL 300} {PGL 500}{PGL700}ポリグリセリンポリグリセリンポリグリセロール{Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024

cactvs>

これにより、すべてのPUGの醜さが隠されますが、いずれにせよ、PUG十分に文書化されていると思います。このツールキットは、単純なデータのダウンロードをはるかに超えています。必要に応じて、ローカルSDファイルのようにPubChemを開いてクエリすることもできます。

ただし、PubChemには安全性データは含まれていません。また、安全性データは国/地域に依存し、厳しく規制されているため、責任を負わないように十分に注意する必要があります。法務担当者にアプローチを確認してもらってください。

于 2011-05-10T16:44:45.617 に答える