問題タブ [rdkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - RDKit を使用して分子フィンガープリントと SMILE 構造のリストの類似性を計算する方法は?
RDKit を使用して、SMILE 構造を持つ分子の 2 つのリスト間の谷本係数に基づいて分子の類似性を計算しています。これで、2 つの個別の csv ファイルから SMILE 構造を抽出できるようになりました。これらの構造を RDKit の指紋モジュールに入れる方法と、分子の 2 つのリスト間でペアごとに類似性を計算する方法を知りたいですか?
私が持っているすべての SMILE 構造 (10,000 以上) を「ms」リストに入れ、それらのフィンガープリントを取得したいと考えています。次に、2 つのリストの分子の各ペアの類似性を比較します。おそらくここで for ループが必要でしょうか?
前もって感謝します!
pandas データフレームを使用して、構造を含むリストを選択して出力し、リストを list_1 と list_2 に保存しました。ms1 行まで実行すると、次のようなエラーが発生します。
次に、ファイルを確認したところ、smiles 列に SMILES しかありません。しかし、テストのためにいくつかの分子構造を手動でリストに入れると、まだエラーがあります
たとえば、ガドジアミドの SMILES は「O=C1[O-][Gd+3]234567[O]=C(C[N]2(CC[N]3(CC([O-]4)=O] )CC[N]5(CC(=[O]6)NC)CC(=O)[O-]7)C1)NC"、およびエラー コードは次のとおりです (fps ラインの実行時)。
元の csv ファイルが次のような場合に、分子名を類似値とともに出力ファイルに含める方法:
名前、笑顔、値、値 2
分子1,CCOCN(C)(C),0.25,A
分子2、CCO、1.12、B
分子3、COC、2.25、C
出力ファイルに分子名を含めるためにこれらのコードを追加しましたが、これらは名前に関する配列値エラーです (特に d2 の場合):
python - 分子をグラフ表現からRDKit Molに変換する方法
私は分子を含む Python プロジェクトに取り組んでおり、今のところ分子をグラフとして表現しています。各グラフを表す 3 つの異なる numpy 配列があります。バイナリ隣接行列、分子内の各原子の原子番号を格納する配列、原子間の結合の種類を格納する行列です。i はグラフで重い原子のみを表しているため、水素はありません。
私は分子の有効性を確認する方法を探しています。RDKit の SanitizeMol 関数を使用してそうしようとしています。グラフを Mol オブジェクトに変換する簡単な方法はありますか?
numpy 形式を Networkx グラフに変換する関数もありますが、次の手順 (nx から RDKit) を実行する方法が見つかりません。
EditablMol を使用して Mol を手動で作成しようとしましたが、グラフに水素がないため、いくつかの原子の原子価に問題が発生します。私は少し立ち往生しています、どんな助けも大歓迎です。
ありがとう
python - モーガン伯爵の指紋を numpy.array として計算するにはどうすればよいですか?
rdkit を使用して、数え切れないほどの Morgan フィンガープリントを生成し、それらを scikit Learn モデル (Python) にフィードしたいと考えています。ただし、フィンガープリントを numpy 配列として生成する方法がわかりません。私が使うとき
変換する必要がある UIntSparseIntVect を取得します。私が見つけた唯一のものは cDataStructs (参照: http://rdkit.org/docs/source/rdkit.DataStructs.cDataStructs.html ) でしたが、これは現在 UIntSparseIntVect をサポートしていません。