1

ルート化されていないツリーを構築し、 outgroup を明示的に指定することでルート化できるようにする他のパッケージ、特にape for R があります。

対照的に、BioPython ではルートを指定せずにルート付きツリーを直接作成できるため、たとえば次のコードからルートがどのように決定されているのか気になります。

from Bio import AlignIO
alignment = AlignIO.read('mulscle-msa-aligned-105628a58654.fasta', 'fasta')
from Bio.Phylo.TreeConstruction import DistanceCalculator
calculator = DistanceCalculator('ident')
dm = calculator.get_distance(alignment)
from Bio.Phylo.TreeConstruction import DistanceTreeConstructor
constructor = DistanceTreeConstructor()
tree = constructor.upgma(dm)
from Bio import Phylo
Phylo.write(tree, 'phyloxml-7016bed7d42.xml', 'phyloxml')

ツリーが構築された後にここでシーケンスを作成しましたが、それでもこれはそのプロセスから構築された根付きツリーです。

ここに画像の説明を入力

4

1 に答える 1

1

@celが言ったように、これはUPGMAアルゴリズムの製品です。UPGMA は、現在 (またはデータの元) からさかのぼってツリーを作成します。最も類似した 2 つの種を見つけることから始めます。理論的には、これらの種は他の種のペアよりも最近の共通の祖先を持っているため、1 つのグループにまとめられます。ツリー内の他の種に対するそれらの共通の祖先の類似性は、グループのすべてのメンバーに対する各種の類似性を平均することによって大まかに推定されます。

このプロセスは続き、各ステップでツリー内の最も類似した 2 つの種 (または共通の祖先と推定される種) をグループ化し、2 つのグループだけが残るまで類似性を再計算します。これらのグループの 1 つにメンバーが 1 つしかない場合があります。この場合、実質的にアウトグループと見なすことができますが、両方とも多くのメンバーを持つ場合もあります。ツリーのルートは、これら 2 つのグループの共通の祖先です。

于 2015-05-15T04:13:14.903 に答える