問題タブ [dendextend]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - デンドログラムの線の長さを調整するには?
このコードを R で使用すると、
私はこれを得る:
それで、これらの行を短くする方法。この方法はほとんど読めません。
はい、私のラベルは、distanceMatrix.csv の最初の行と同じように並べられています。この順序は、distanceMatrix 内のリレーションとは関係ありません。つまり、デンドログラムは問題ありませんが、ラベルの値が正しくありません。
ありがとう
r - Rのデータフレームの列番号に基づいて樹状図の最後の枝(または葉)を着色する
dataframe から、樹形図をdata.main
次のように生成できます。hclust
さらに、木のカットオフを使用して枝や葉に色を付ける方法があることも知っています。ただし、部分的な列名または列番号に基づいて色を付けることは可能ですか (たとえば、に対応するブランチをaa1
赤くaa2
、bb1
青くbb2
したい)?
R パッケージを確認しましたdendextend
が、目的の結果を得るための直接的/簡単な方法をまだ見つけることができません。
r - 垂直および水平デンドログラムのラベル付け
私はRが初めてで、dist()とhclust()を使用して水平および垂直のラベル付きデンドログラムを構築しようとしています。6 つの異なるタイプを作成しましたが、ラベルを追加できないようです。誰か提案があればありがとう。
as.dendrogram()、colnames()、rownames()、および label() を使用して、これらのデンドログラムにラベルを付けるさまざまな方法を試しましたが、成功しませんでした。ただし、出力デンドログラムには意味のないラベルが付いています。「ファミリー」 - 「X22」、「X4」、「X75」、「X87」でデンドログラムにラベルを付けようとしています。以下は、無駄に適用されたさまざまな方法です。
データフレームは次のとおりです。
このコードは、この行列を生成します。ただし、表記はありません
これらは、ラベルを追加する私の試みです
r - 行の名前を変更して dist() および promp() オブジェクトの項目を制御する
ファミリー 1 と呼ばれるデータ フレームがあります (以下)。このデータは、デンドログラムの作成と主成分分析に使用されます。dist() オブジェクトと promp() オブジェクトの両方でアイテムの名前を制御したいと考えています。これらのオブジェクトは行名を使用してアイテム間の関係 (つまり、非類似度マトリックス) を示します。行に体系的に名前を付けることで、さまざまなデンドログラムの配列を作成しました (以下のコード)。しかし、私の苗字は英数字の「X22」、「X2」、「X75」、「X87」で、行ごとに違うので、Rさんは混乱しているようです。データ フレームは非常に大きくなり、体系的に行に名前を付けることは網羅的になります。データ フレームの各行は、異なるファミリ名 (つまり、「X22」、「X87」、「X22」、「X4」、「X22」.....) でラベル付けおよび順序付けできます。以下の例では、ddply() を使用して姓を整理しました。私が求めている質問は、この大規模なデータセットの行名の名前を、列見出し「家族」の下に含まれる正しい対応する家族名に変更する方法です。次に、データ フレームから列 "Family" を抽出し、dist() と promp() を使用するときに、SBI.x の値に対するファミリ間の非類似性関係を示す行名に頼ることができます。
r - 定義されたグループに従って樹状図のラベルに色を付ける方法は? (R)
R に 24 行 10,000 列の数値行列があります。この行列の行名は基本的に、24 行のそれぞれに対応するデータを読み取ったファイル名です。これとは別に、24 個のファイルが属するグループを指定して、24 個の全体を含む別の因子リストがあります。アルコール、炭化水素、エステルの 3 つのグループがあります。名前と、それらが属する対応するグループは次のようになります。
樹状図を生成して、マトリックス内のデータをどのようにクラスター化できるかを調べたいと思いました。したがって、次のコマンドを使用しました。
そして私は樹状図を得ました。ここで、樹状図のファイル名を、それらが属するグループ、つまりアルコール、炭化水素、またはエステルに応じて色付けしたいと考えています。フォーラムに投稿されたさまざまな例を見ました
ape パッケージを使用した R の葉の樹状図のラベル付けと色付け
、しかし私のデータには実装できませんでした。樹形図で色付きの名前を取得するために、row.names を MS.groups と関連付ける方法がわかりません。
( https://nycdatascience.com/wp-content/uploads/2013/09/dendextend-tutorial.pdfで説明されているように) dendextend を使用してツリーを生成すると、次のツリーが得られます。
これを生成するために使用されるコードは次のとおりです。
r - R hclust -> デンドログラム -> phylo?
何百ものノードと長いラベルを持つ hclust 階層クラスター オブジェクトがあります。たとえば、ファミリー内の複数の遺伝子の同義語。下記参照。
hclustを小さなサブツリーに分割し、柔軟なスタイルで視覚化したいと考えています。http://gastonsanchez.com/blog/how-to/2012/10/03/Dendrograms.htmlに従って、樹状図を切り取り、類人猿の系統樹をきれいにプロットする方法を確認します。
カットされたデンドログラムをフィロオブジェクトに変換する方法がわかりません。
私は、円形または垂直方向のサブツリーをレンダリングする任意の方法を受け入れます。
実際、私の目標は、遺伝子同義語のパターンを視覚的に検出して、それらの口ひげテンプレートのようなものを作成できるようにすることです。 プレーン テキストの複数の配列アラインメントに関する SO の投稿がいくつかありますが、それらは私の頭を少し超えています。
r - 先端(葉)の色に合わせたデンドログラムのエッジ(枝)の色(サルパッケージ)
ape パッケージの plot.phylo コマンドを使用して、R の系統発生タイプのプロットのエッジ (線) に色を追加しようとしています。この例は「ファン」タイプのプロット用ですが、アプローチは「フィログラムタイプ」などと同じになると思います。
グループのセットに基づいてヒント (ラベル) に色を追加することは、tip.color オプションと cutree コマンドを組み合わせれば問題ありません。
edge.color オプションは、エッジの色を定義しますが、多くの色が必要な場合はログイン式ではありません。
ただし、デンドログラムのブランチが特定のグループに向けられたら、端を端末の先端の色と一致させたいと思います。与えられた例では、赤と青のグループに向かって、エッジの最初のレベルは黒のままですが (赤と青の 2 つのグループに向かっているため)、これを超えるエッジは最終的な先端の色と同じ色になります。
as.phylo オブジェクトの $edge 値の順序を理解することが鍵だと思いますが、自分では理解できません。ありがとう。
r - Rでクラス「デンドログラム」の水平デンドログラムに識別を使用する方法
R のデンドログラム内のクラスターの特定の機能を調べるために、identify を使用しています。Identify は、「hclust」オブジェクトを使用して完全に正常に機能していますが、「 hclust」ではなく「dendrogram」クラスの水平デンドログラムに必要です。パッケージ dendextend をインストールしました。これは通常、identify の機能をクラス dendrogram のオブジェクトと水平樹形図 ( http://rpackages.ianhowson.com/cran/dendextend/man/identify.dendrogram.html ) に拡張する必要があります。私の特定のデータセットでは、identify は (クラスの樹状図の) 垂直樹状図では機能していますが、水平樹状図では機能していません。私がいつも得るエラーは次のとおりです。
再現可能で単純化された例をここで見つけてください。
誰かがこの問題を解決する方法を知っていることを願っています。
一番、