rdkit を使用して、数え切れないほどの Morgan フィンガープリントを生成し、それらを scikit Learn モデル (Python) にフィードしたいと考えています。ただし、フィンガープリントを numpy 配列として生成する方法がわかりません。私が使うとき
from rdkit import Chem
from rdkit.Chem import AllChem
m = Chem.MolFromSmiles('c1cccnc1C')
fp = AllChem.GetMorganFingerprint(m, 2, useCounts=True)
変換する必要がある UIntSparseIntVect を取得します。私が見つけた唯一のものは cDataStructs (参照: http://rdkit.org/docs/source/rdkit.DataStructs.cDataStructs.html ) でしたが、これは現在 UIntSparseIntVect をサポートしていません。