2

Biopython で MultipleSequenceAlignment を実行したいのですが、自己定義のアルファベットを使用します。背景は次のとおりです。私のシーケンスは数値状態のシーケンスであり、最大 5000 の状態があります。したがって、「0001」、「0042」、「4999」など、5000 文字のアルファベットが必要です。これらのシーケンスは、最大 50 州/文字の長さです。

だから私の主な質問は次のとおりです。

  • そのようなアルファベットをどのように定義できますか?
  • MultipleSequenceAlignment でこのアルファベットを使用するにはどうすればよいですか?

あるいは、シーケンスの代わりにリスト/配列で MultipleSequenceAlignment を実行することは可能ですか?

時間とヘルプをありがとう!

4

1 に答える 1

0

Alphabet サブクラスを定義できますBio.Alphabet.Alphabet。おそらくあなたのケースは次のようになりThreeLetterAlphabetます:

class ThreeLetterProtein(Alphabet): 
    """Three letter protein alphabet.""" 
    size = 3 
    letters = [ 
        "Ala", "Asx", "Cys", "Asp", "Glu", "Phe", "Gly", "His", "Ile",
        "Lys", "Leu", "Met", "Asn", "Pro", "Gln", "Arg", "Ser", "Thr",
        "Sec", "Val", "Trp", "Xaa", "Tyr", "Glx",
        ]

質問の2番目の部分は紛らわしいです。Biopython にアライメントを実行してもらいたい場合、AFAIK 以外では実行できませんBio.pairwise2。Biopython には、Muscle、Clustal、TCoffee などの一般的なアライメント ツールのラッパーしかありません。出力を のように読み取ることができMultipleSeqAlignmentますBio.AlignIO

于 2015-10-05T16:13:36.530 に答える