問題タブ [ape-phylo]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: サル/フィロベース: ウルトラメトリックの二分木を hclust オブジェクトに変換できません (警告メッセージ)
read.treeape 関数とape パッケージの関数を使用して、R に ClustalW2 ツリーをインポートしました。私は chronopl 関数を使用して分子年齢を推定し、ウルトラメトリックな二分木を作成しました。そこから樹状図オブジェクトで R ビルドを作成したいと考えています。
木はきれいにプロットされ、本物のファイロ オブジェクトです。ただし、変換しようとすると問題が発生します。
最小限の作業例:
結果のツリーは問題なく「見える」ので、ツリーがウルトラメトリックおよびバイナリではないことを確認するためにテストし、それを hclust オブジェクトに変換して、最終的にその樹状図オブジェクトを作成します。
ツリーから hclust オブジェクトを作成しようとすると、次のエラーが発生します。
これは非常に詳細な質問であり、特定のパッケージに特に関連する質問は別の場所で尋ねたほうがよいかもしれませんが、誰かが私を助けてくれることを願っています.
すべての助けに感謝します。
よろしく、
ファイルのダウンロード
Phylip ファイルはhttp://www.box.net/shared/rnbdk973jaからダウンロードできます 。
r - R での系統樹の正規化
R で系統樹データを操作する場合 (特に「phylo」または「phylo4」オブジェクトを操作する場合)、特定の分類群 (より速く進化するもの) が不均衡な量の枝の長さに寄与しないように、枝の長さを正規化すると便利です。木に。これは、http: //bmf2.colorado.edu/unifrac/help.pspでの議論に見られるように、UniFrac 値の計算では一般的なようです。(ただし、UniFrac 値以上のものが必要です)。
ただし、この正規化ステップを実行する関数が見つかりません。類人猿、ピカンテ、アデフィロ、フィロベースを調べました。この関数を含むパッケージ、またはこの種の関数を簡単に記述できるパッケージを教えてもらえますか?
r - devSVGに保存するときに、R apeパッケージの系統樹のチップラベルのフォントファミリを変更するにはどうすればよいですか?
RNewick形式からインポートされたいくつかの系統樹があります。apeこのパッケージを使用して、plot.phyloコマンドでツリーをプロットしています。チップラベルのフォントファミリ(サイズだけでなく、でできるcex、または色で)をモノスペースに変更できるようにしたいと思います。コマンドは引数を取りますが、を渡しても何も起こりません。入れてみてもうまくいきませんでした。colplotfamilyfamily="mono"par
私と同じ
そして、フォントの変更をお願いします。
編集:フォントファミリの指定は、グラフィックをに保存するときに機能するようですが、では機能pngしませんdevSVG。更新されたフォントをに保存するにはどうすればよいSVGですか?
r - 系統樹と x,y グラフを組み合わせる
関連生物のセットの生理学的データを示すグラフに系統樹を配置しようとしています。下の写真のようなもの。これは、2 つの別々のグラフからパワーポイントでまとめたものです。仕事は終わったと思いますが、ドキュメントにフォーマットしやすいと思う単一の画像を作成したいと思っていました。ggplot2 を使用して必要なグラフを作成し、ape を使用してツリーをインポートできます。ツリーをグラフィカル オブジェクトとして保存し、gridExtra の gridarrange 関数を使用してグラフに配置する方法があるはずだと考えていました。問題は、サルがツリーをグラフィカルオブジェクトとして保存できないことです。たとえば、
ツリーをプロットするだけで、p2 を呼び出すと、引数のリストが表示されます。誰かヒントがあればと思っています。
ありがとう!

r - データフレームに保存された DNA シーケンスで as.DNAbin{ape} を使用するには?
1 つの列に遺伝子座名があり、もう 1 つの列に DNA 配列があるデータフレームがあります。as.DNAbin{ape}DNAbinオブジェクトを作成するために、または類似のものを使用しようとしています。
ここにいくつかのサンプルデータがあります:
x <- structure(c("55548", "43297", "35309", "34468", "AATTCAATGCTCGGGAAGCAAGGAAAGCTGGGGACCAACTTCTCTTGGAGACATGAGCTTAGTGCAGTTAGATCGGAAGAGCA", "AATTCCTAAAACACCAATCAAGTTGGTGTTGCTAATTTCAACACCAACTTGTTGATCTTCACGTTCACAACCGTCTTCACGTT", "AATTCACCACCACCACTAGCATACCATCCACCTCCATCACCACCACCGGTTAAGATCGGAAGAGCACACTCTGAACTCCAGTC", "AATTCTATTGGTCATCACAATGGTGGTCCGTGGCTCACGTGCGTTCCTTGTGCAGGTCAACAGGTCAAGTTAAGATCGGAAGA"), .Dim = c(4L, 2L))
y <- as.DNA(x)R が長さ 2 (2 つの列だと思います) の 4 つの DNA シーケンス (例の 4 行) を持つ一種の DNAbin オブジェクトを作成しようとすると、ラベルはなく、もちろん塩基組成も機能しません。
ドキュメントはあまり明確ではありませんが、パッケージの woodmouse サンプル データで遊んだ後、各ベースを列として行列を作成し、 を使用する必要があると思いますas.DNAbin。つまり、上記の例では 4 x 84 の行列 (遺伝子座名に 1 列、配列に 83 列?)。これを行う方法に関するアドバイスはありますか?または、より良いアイデアはありますか?
ありがとう
r - gls の推定値を抽出する
corPagel (パッケージ ape で定義) から取得した相関構造を持つ ML によって適合するモデルからパラメーターを抽出しようとしています。対象のパラメーターは、概要のapVarという名前の要素内にあります。
このコードは次の出力を生成します (モデル m の dput をここからダウンロードしてください)。
最初の行列の値を抽出するのは簡単ですが、要素attr(, "Pars")内の corStruct の値を抽出するにはどうすればよいですか?
python - マルチプロセッシングとrpy2(ape付き)
今日これに遭遇しましたが、理由がわかりません。大規模なパイプラインの一部として、時間のかかる操作を実行するいくつかの関数がチェーン化されています。これらをここに含め、できる限りテスト例に絞り込みました。問題は、関数を直接呼び出すと、期待される出力 (たとえば、5 つの異なるツリー) が得られることです。ただし、マルチプロセッシング プールで apply_async (または適用は関係ありません) で同じ関数を呼び出すと、5 つのツリーが得られますが、それらはすべて同じです。
これを IPython ノートブックに文書化しました。これは次の場所で表示できます: http://nbviewer.ipython.org/gist/cfriedline/0e275d528ff1a8d674c6
セル 91 で、5 つのツリー (それぞれに 10 個のヒント) を作成し、2 つのリストを返します。1 つ目は非マルチプロセッシング ツリーを含み、2 つ目は apply_async からのものです。
セル 92 では、マルチプロセッシングを使用せずにツリーを作成した結果を確認できます。セル 93 では、マルチプロセッシングを使用してツリーを作成した結果を確認できます。
私が予想しているのは、2 つのテストの間に合計 10 個の異なるツリーが存在することですが、代わりにすべてのマルチプロセッシング ツリーは同一です。私にはほとんど意味がありません。
物事の関連バージョン:
- Linux 2.6.18-238.12.1.el5 x86_64 GNU/Linux
- Python 2.7.6 :: アナコンダ 1.9.2 (64 ビット)
- IPython 2.0.0
- Rpy2 2.3.9
ありがとう!クリス
r - haploNet Haplotype Networks {pegas} で円グラフをプロットする方法
{pegas} の haploNet 関数を使用してハプロタイプ ネットワークをプロットしようとしていますが、同じ円グラフに異なる集団からの等しいハプロタイプを配置するのに問題があります。次のスクリプトでハプロタイプ ネットを構築できます。
各分類群の元の集団のラベルを dnabin データに設定したいので、結果のネットワークで (異なる集団からのハプロタイプの) 異なる色の円グラフを作成できます。結果のハプロタイプ ネットワークで重複する円も削除したいと思います。
助けてくれてありがとう!
例:
このスクリプトは、{pegas} を使用してハプロタイプ ネットワークを構築するために使用されます。大きな円は、あるタイプのより多くのハプロタイプを表しています。ハプロタイプの起源を dnabin マトリックスに設定する方法を知りたいので、ネットワーク内で異なる色で表示されます。