Clustalw の複数の配列アラインメントから Biopython で位置加重行列 (PWM) を生成しようとしています。ギャップのあるアラインメントで行うたびに、「間違ったアルファベット」エラーが発生します。ドキュメントを読むと、ギャップのあるアラインメントの「-」文字を処理するには、ギャップのあるアルファベットを利用する必要があると思います。しかし、これを行ってもエラーは解決しません。誰かがこのコードの問題を見ていますか、またはギャップのあるClustalアライメントからPWMを生成するより良い方法を持っていますか?
from Bio.Alphabet import Gapped
alignment = AlignIO.read("filename.clustalw", "clustal", alphabet=Gapped)
m = Motif.Motif()
for a in alignment:
m.add_instance(a.seq)
m.pwm()