私はBiopythonのpairwise2関数にある程度精通していますが、可能な限り最高のアライメントスコアを得るために、シーケンス内にダッシュを追加することに気付きました. 例えば、
for a in pairwise2.align.globalxx("ACCGT", "ACG"):
print(format_alignment(*a))
次の結果が得られます。
ACCGT
|||||
A-CG-
Score=3
<BLANKLINE>
ACCGT
|||||
AC-G-
Score=3
<BLANKLINE>
2 番目のシーケンスの最初の 2 文字 (A & C) は 1 番目のシーケンスと一致しますが。アラインされた塩基対の最大数ではなく、アラインされた塩基対の数を見つける方法はありますか (たとえば、ACTGAA のシーケンスは、GCCGTA のシーケンスに対して 3 のスコアを持ちます)