問題タブ [phylogeny]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Caper R パッケージの pgls() からスチューデント化された残差を取得する方法
135 種、6 つの生活史特性 (応答)、2 つの環境変数 (予測因子) を含むデータセットがあります。パッケージCaperを使用してpgls回帰分析を行い、生活史の各特性に対する環境変数の影響を調べることに興味があります。形質の 1 つは女性の体重であるため、女性の体重に対する各形質の pgls 回帰を計算し、その後の残差を環境変数に対する多変量回帰に使用しました。回帰診断が体重に対する一変量特性回帰で問題ないことを確認するために、plot.pgls() を使用しました。プロットは、いくつかの外れ値の存在を示しました。Caper で pgl を使用した一部の論文では、スチューデント化された残差が 3 を超えるデータ ポイントは外れ値として除外されています。
- 誰かが Caper の pgls 回帰からスチューデント化された残差を計算する方法を理解するのを手伝ってくれますか?
- pgls 回帰は、系統発生残差と非系統発生残差を示します。スチューデント化された残差が計算されるのはどれですか?
お時間とご協力ありがとうございます、pb
python-2.7 - Biopython Phylo で端末の名前が None に変更される
私は Biopython を使用していくつかのアミノ酸配列を Clustal-Omega と整列させ、生成されたツリーをインポートしています。
したがって、インポートされたツリーには、None という名前のリーフ/ターミナルがいくつかあり、同等の数の名前付きリーフがありません。
ツリーのファイル (clustalo によってフォーマットされたもの) を調べてみたところ、名前が変更されている遺伝子の後に常に -0 があることに気付きました。
-0 は何を意味し、これを修正してすべての端末に名前を付けるにはどうすればよいですか?
補足として、fasta ファイルに DNA シーケンスを入力してアラインし、そのツリーをインポートすると、問題が発生していないようです。
clojure - 「再ルート可能な」純粋に機能的なツリー データ構造
私は最近、系統樹を推測するための数学的および計算方法に関する素晴らしい本である Joseph Felsenstein によるInferring Phylogeniesを購入し、そこに記述されているアルゴリズムのいくつかを実装して遊んでいます。
具体的には、永続的なデータ構造を備えた機能的な設定で使用することに興味があります。多くの方法では、可能なツリーのスペースを歩く必要があり、構造を介して行ってきた場所の履歴を安価に覚えておくとよいでしょう。共有 (このブログ投稿の「ワールド」で aphyr が行うことのようなもの)、以前に計算されたサブツリーの値を簡単にキャッシュするなど。
これに関する問題は、多くの方法がツリーの「ルート変更」を伴うことであり、純粋に機能的な方法で安価に行う方法がわかりません。基本的に、次のそれぞれのアイデアをキャプチャする何らかの方法が必要です (ツリーをベクトルとして表す clojure 表記法を使用):
同じデータを表し、ルートが配置されている場所のみが異なります。それらはそれぞれ根のないツリーを表します。
これらのツリーの 1 つにジッパーで移動してから関数を呼び出すとreroot
、ルートが現在の になるように圧縮された新しいツリーが返されloc
ます。
Felsenstein という本の中で、低コストでルートを変更できるツリーのデータ構造について説明しています。
円は構造体で、矢印はポインタです。構造体のリングはツリーの内部ノードであり、構造体への参照を取得したら、ポインターの交換を行うことでルートをそこに移動できます。残念ながら、これは変更操作であり、相互参照が必要ですが、どちらも純粋に機能的な設定では不可能です。
ジッパーを使ってやりたいことをする方法があるはずだと思いますがclojure.core/zip
、しばらくいじっていて、どこにも行きません.
このようなものの実装を知っている人はいますか、または私が読むべきこと/私が見るべき論文/これを行う方法についてのアイデアについての提案はありますか?
ありがとう!
r - 系統祖先の再構築: 一方向性形質状態変化のモデルを指定 [ape][phytools]
系統樹とそのツリーの文字データがあるとします。単方向であることがわかっている文字が 1 つあります。0 から 1 への遷移率は正ですが、1 から 0 への遷移率はゼロです (たとえば、0 は 2 倍体、1 は倍数体です)。ツリーの祖先の再構築を行いたいとしましょう。パッケージ Ape の Ace またはパッケージ phytools の make.simmap を使用して祖先の再構築を行うことができることは知っていますが、一方向の文字変更のモデルを指定する方法がわかりません。
例:
誰が何をすべきか考えていますか?
tree - Biopython で生成されたブートストラップ系統樹を Bio.Phylo.write() を使用してファイルに書き込む
Bio.Phylo
ブートストラップ値を使用して(から) BioPython Tree オブジェクトをエクスポートする際に問題があります。木は、距離行列に基づいて BioPython スクリプト内で直接作成されます。
ツリーは基本的に見栄えがしますが、Bio.Phylo.write()
関数を使用してそれらをファイル (Newick、NEXUS、または phyloXML 形式) にエクスポートすると、ブートストラップ サポート値が誤った形式でエクスポートされるようです。
ツリー トポロジは、ITOL や Dendroscope などを使用して適切に表示できますが、ブートストラップ値は表示できません。
ツリー オブジェクトと、結果の newick および phyloxml ファイルの例を以下に示します。正しい (読み取り可能な) ブートストラップ値でツリーをエクスポートするにはどうすればよいですか?
例:
これは、ツリーオブジェクトが BioPython でどのように見えるかです (AF という名前の 5 つの「種」を持つツリーの例):
これを newick 形式 ( --> Bio.Phylo.write(mytree,outfile,"newick")
) にエクスポートすると、ファイルは次のようになります。
ご覧のとおり、信頼値は内部ブランチ ラベルと連結されているため、判読できません (たとえば、name="Inner1" の場合は "Inner140.00"、confidence=40.0 の場合)。
phyloXML 形式では、ツリー ファイルは次のようになります。
これははるかに良く見えますが、信頼値は ITOL などのツリー視覚化ツールによって認識されません (おそらく信頼タイプ = "不明" ラベルが原因でしょうか?)
私に何ができる?最終結果ファイルを変更するのは危険に思えます (「inner」などのキーワードを含むリーフ ラベルが実際に必要な場合はどうすればよいでしょうか?)
また、依存関係として追加の外部 Python モジュールを追加すると、協力パートナーのためにツールを実装するのが複雑になるため、BioPython モジュールに限定したいと思います。
python - Pythonでは、Bio.Phylo.draw()を使用して系統樹を生成するときに葉ノードのフォントサイズを変更するにはどうすればよいですか?
Biopython の Phylo パッケージを使用して系統樹を作成しています。
大きな木の場合、葉ノードのフォントサイズを小さくする必要があります。matplotlib.pyplot.rcParams['font.size'] を変更することが提案されていますが、Phylo は独自のフォント サイズを定義しているため、軸の名前とタイトルを変更することしかできません。大学で使用しているため、Phylo のソース コードを変更できません。Phylo.draw() は独自のものを作成するため、図または軸の定義はオプションではありません。
おそらくy軸を伸ばすなど、問題を解決する方法について何か提案はありますか?
これまでのところ、次のコードを使用してツリーを生成していました。
r - R ツリーの newick 形式でヒントを見つける
Newick ツリーを ape (read.tree) で R にインポートしました。問題は、1000 個のヒントがあるため、ツリーをプロットするとラベルが重なることです。非常に長い表現なので、ここではツリーをコピーしません。どの個体が木のどの先端にいるかを確認する方法はありますか?
1000個の標本のうち、それらがチップに1から1000まで順番に配置されているとは思いませんが、ツリーが何らかの形でそれらを再配置したとは思いません...したがって、チップラベルまたは何かの新しいシーケンスが必要になります...
ツリーは次のようになります。
![ここに画像の説明を入力][1]
色を無視して、一連のヒントを取得できるようにする必要があります...下からの最初のヒントがヒント79で、次にその上のヒントが82、次に87という単一のケースを考えてみてください.. ..
ここのような木を考えてください
また、そこからヒントラベルだけを含むベクトルを取得するにはどうすればよいですか?