0

すべての化合物について事前に計算された Avalon フィンガープリントを使用して、化学データベースで部分構造検索を実行しようとしています。これらのフィンガープリントを RDKit で比較する方法があります。

DataStructs.AllProbeBitsMatch ( fp1, fp2 )

ドキュメントでは、このメソッドを次のように説明しています。

彼らはビットベクトルについて話しますが、このフィンガープリントは「単語として」計算することもできます (整数の配列、RDKit の GetAvalonFPAsWords メソッドを介して、MongoDB に保存し、できれば RDKit なしでデータベースの力のみを使用して検索を実行できます (これは必要です)はるかに高速になります)。

これが私の質問です。ビット ベクトルの AllProbeBitsMatch と同等の配列の操作が必要です。理想的には、この操作は MongoDB で実行する必要があります。おそらく、パフォーマンスを向上させるために集約機能を使用します。

これは、参照用に使用する RDKit および Avalon フィンガープリントの記事です: http://rdkit.blogspot.com/2013/11/fingerprint-based-substructure.html

4

0 に答える 0