問題タブ [phylogeny]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
421 参照

python - UnicodeDecoderror: 'ascii' コーデックは位置 5 のバイト 0xe9 をデコードできません: 序数が範囲外です (128)

私はプログラマーではなく、プログラミングの上級者でもないので、私の質問にあまり腹を立てないでください:D

問題は、私は生物学者であり、プログラミングを少し学び始めたところです (私はしなければなりません)。このサイトdendropy/sumtreesの説明を使用して python 経由でインストールしようとしていました。

私は

cプロンプトで、次のメッセージを受け取りました:

誰でも私を助けることができますか?(量子物理学の基礎を理解するためにサルに使用している言葉を使用して...) よろしくお願いします:)

0 投票する
1 に答える
220 参照

r - 系統樹 - 種マトリックスごとにブランチを作成する方法は?

R で系統樹を操作して、ツリーの各ブランチ (B1 から B8) が各種 (A から E) に関連付けられているかどうかを示すマトリックスを作成したいと思います。ここで、1 はブランチが関連付けられていることを示します。(下に示された)

R 関数 which.edge() は、種の末端分岐を識別するのに役立ちます。しかし、それぞれの種に関連するすべてのブランチを識別するわけではありません。種ごとに、木の根元から先端までのすべての枝を特定するには、どの関数を使用できますか?

例の木

これは、私が作成したいマトリックスです (種 AE を列として、分岐 B1-B8 を行として) が、手動ではなく簡単な関数を使用します。

たとえば、分岐 B2 は種 BE には行きますが、種 A には行きません。種 E には、分岐 B2、B6、B8 が存在します。

どの R 関数が最適でしょうか? 前もって感謝します!

0 投票する
1 に答える
106 参照

r - 繰り返しシミュレーション回数のスコアを計算するループを作成する方法は?

multiphylo オブジェクトから各系統樹を取得し、各ツリーの Ic を計算してデータフレームに入れる、非常に単純なループが必要です。とても単純で申し訳ありませんが、私はRが初めてで、理解できませんでした!

0 投票する
2 に答える
65 参照

r - 出力から NULL を削除し、望ましい長さに縮小するループを作成する方法は?

次のコードは、多数の系統樹 (ここでは 100) をシミュレートします。しかし、絶滅の偶然の出来事のために、いくつかの木はNULLです。これらの NULL ツリーを確認し、出力オブジェクトから削除して、残りのツリーから N 個のツリーから x 個を選択する必要があります。

上記のコードが 3 つの NULL を返し、(たとえば) 100-3=97 ツリーから 50 を選択する必要があるとします。最初の 50 本の木でも何でもかまいません。ループでそれができるかどうかはわかりません。

ご協力いただきありがとうございます!

0 投票する
2 に答える
3878 参照

r - 系統樹で枝の長さを表示する方法

ここに、newick 形式から単純な系統樹を描画するコードがあります。

私は正しい長さの枝を「表示」していますが、すべての枝にラベルを付けたいです。 ここに画像の説明を入力

編集: プロットを次のように表示したい: ここに画像の説明を入力 ドキュメントを検索していましたが、R でブランチの長さを表示する方法が見つかりません。これを行うにはどうすればよいですか?

0 投票する
1 に答える
825 参照

r - いいえの系統発生的一般化線形モデル。r の応答としての成功/失敗の数

私は、各植物種 (n=550) が何かを成功または失敗する頻度、つまり成功数と失敗数に関する情報を含む植物データセットを持っています。データセットには、種子のサイズ、競争力、最大散布距離など、各植物種の特性に関するデータも含まれています。ほとんどの説明変数は連続ですが、1 つはバイナリ (菌根の有無) です。通常、植物が何かを行うことに成功する回数がその特性に関連する程度を分析するには、次のような方法で家族の二項式で GLM を使用すると思います。

ただし、これらの形質の一部は植物の進化の歴史に結びついている可能性があるため、その結果として生じる可能性のある偏りを考慮したいと思います. したがって、系統発生情報をモデルに含めたいと思います。継続的な応答がある場合は、PGLS (caper パッケージ) を使用できますが、私の目的では、上記のようなロジスティック回帰の方が適切だと思います。1 つの方法は、phylolm パッケージの phyloglm 関数を使用することです。代替手段もありますが、それらすべてに共通するのは、応答をバイナリ変数にする必要があることです。私はそうではありませんが、種ごとに複数の入り口を持つバイナリーを作成できました。ただし、そうすると、分析データセットの行数が系統樹のヒントの数よりもはるかに多いという問題に遭遇する可能性が高くなります!

要するに、応答として 2 列の変数 (成功数、失敗数) を取り、連続変数とカテゴリ変数の両方をサポートする系統発生ロジスティック回帰が必要です。

助けていただければ幸いです。

0 投票する
1 に答える
100 参照

r - 木を極端な形状に再スケーリングする方法は?

@jeremycg が次のコードの開発を手伝ってくれましたが、これを再度投稿します。それは機能しますが、私が望んでいたものではありません! 簡単なリマインダー: ガンマと呼ばれる係数に関して測定する必要がある一連の木があります。各木の値が定義された範囲内にない場合は、その値が定義された範囲内になるまで再スケーリングされます...この例を試してみましょう:

ありがとう!