問題タブ [phylogeny]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rにおける系統樹の枝長変更
非常に短い長さ (約 1.042e-06) のいくつかの距離を持つ NEWICK 形式の phylo ファイルがあり、これらの小さな距離を「削除」する必要があります。
さらにツリーが必要な場合、この乗算は何の効果ももたらさないため、すべての距離を 10 倍することを考えました。それを行うために、R と function でapeパッケージを見つけました。compute.brlen
この関数を使用すると、関数によって枝の長さを変更できます。
この関数で枝の長さを 10 倍にする方法について何か考えはありますか?
私はやろうとしましたがcompute.brlen(tree, main=expression(rho==10))
、これは私が望むものには間違っていると思います.
r - Phylocom 非ウルトラメトリック ツリーとウルトラメトリック ツリー
また。
もう一度助けが必要です。
最近では、さまざまなサンプルから系統発生の特徴を推測するために PHYLOCOM ソフトウェアを使用しています。このソフトウェアを使用すると、分析で種が他の集団内でクラスター化または過分散を示しているかどうかを計算できます。入力ファイルとして、NEWICK 形式の系統樹とサンプル ファイル (.txt) が必要です。
2 つのテストを実行しました。1 つは R のツリーを 'ape' パッケージで次のように変更します。
そして、この他の「猿」オプションによるもう1つ:
最初の変更では、ウルトラメトリック ツリーを使用して出力が生成されますが、2 番目の出力は非ウルトラメトリック ツリーです。その後、PHYLOCOM自体を実行する場合
パラメーターの値だけでなく、意味 p 値でも異なる結果が得られます。
私の質問は、ウルトラメトリックまたは非ウルトラメトリックの入力を使用して、これらの「コンストラクト」分析を正しく行うためにPHYLOCOMを実行する方法を誰かが知っているかどうか、また、これを何らかの方法で実行することと別の方法で実行することの違いは何ですか.
これはstackoverflowフォーラムの「古典的な」質問ではないことはわかっていますが、系統発生を扱っている人なら誰でも助けてくれるかもしれません。
どうもありがとう。
r - R の phangorn を使用した modelTest と負の辺の長さ
タンパク質データセットを分析しています。Rでパッケージを使用してツリーを構築しようとしていますphangorn
。構築すると、エッジの長さが負になり、分析 (modelTest) の続行が困難になることがあります。
データセットのサイズ (250 以上のタンパク質) によっては、modelTest を実行できません。どうやら負のエッジ長による問題があるようです。ただし、より短いデータセットの場合、負のエッジ長がいくつかある場合でも、modelTest を実行できます。
端末から直接実行しています。
誰かが私に何ができるか考えていますか?
乾杯、アルバ
algorithm - リーフ セットが異なるツリーの比較 (リーフ ノードの数とラベルが異なる)
ツリーの構築に使用するファイル/フォルダー構造からの階層データがあります。私は今、これらの木をランダムなものと比較しようとしています。
ランダム ツリーと比較するために、リーフ ノードの数とラベルを保持し、従来のツリー距離メトリック (たとえば、ロビンソン フォールズ距離) を使用できます。それにもかかわらず、さまざまなデータからのさまざまなツリーを比較するために(葉とラベルの数が異なる)、どのメトリック/アルゴリズムを使用すればよいかわかりません。助言がありますか?
ありがとう!
PS-比較の目的は、これらのツリー間のトポロジーがどの程度類似しているかを確認し、どのクラスターが存在するかを確認することです (したがって、フォルダー構造の背後にある生成メカニズムの考えにいくつかの証拠を追加します)。
r - フェノグラムをプロットするときのツリー ヒントの欠落
phytools パッケージを使用してフェノグラムを生成すると、ツリーのヒントとヒント ラベルが表示されません。これを修正する方法、または問題の特性の値でプロットされたy軸を持つノードとヒントを含むフェノグラムをプロットする別の方法について誰かアイデアがありますか?
ここに私が持っているものがあります:
ツリーは次のようになります。
r - 循環系統樹の構築
遺伝子とそれらが関連する疾患の表があります。系統樹を構築し、遺伝子を疾患にグループ化したいと考えています。以下はサンプル データセットです。gene1 列は疾患 1 に属し、gene2 列は疾患 2 に属します。主に、gene1 と遺伝子2は互いに関連しており、それらが属する疾患にマッピングされています。
以下のリンクにあるように、目的のために円形の系統樹が必要です: http://itol.embl.de/itol.cgi
Rまたは任意のソフトウェアでこれを行うための提案はありますか?
ありがとう
私が実行しているコード:
show.tip.label=TRUE を実行すると、プロットされるラベルが多すぎて、ヒントが乱雑になります。
私の変更されたデータセットは現在、遺伝子用と疾患用の 2 つの列のみです。
r - 系統樹
私は、遺伝子のペアワイズ データに基づいて系統樹を作成する作業を行っています。以下は、データのサブセット (test.txt) です。ツリーは、DNA シーケンスに基づいて構築する必要はありませんが、それを次のように扱うだけです。言葉。
以下はRでの私のコードです
私のフィギュアはここに添付されています
それらがどのようにクラスター化されているかについて質問があります。
と
17 と 2 は一緒に、18 と 3 は一緒にあるはずです。
この方法(ユークリッド距離)の使用が間違っている場合、他の方法を使用する必要がありますか?
データを行と列の行列に変換する必要があります。ここで、gene1 は x 軸で、gene2 は y 軸で、各セルは 1 または 0 で埋められますか?(基本的に、ペアになっている場合は 1 を意味し、そうでない場合は0)
更新されたコード:
ただし、これでは、gene2 列ではなく、gene1 からの遺伝子のみを取得します。下の図はまさに私が望むものですが、gene2 列からの遺伝子も含まれている必要があります。