問題タブ [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R でのクラスター分析表現
x と y が空間座標である大規模な空間データセットでクラスター分析を行っています。hclust と dynamicTreeCut を使用しており、表現のために ggplot を使用して散布図を表示しています。
しかし、カットは行または列でしか表示できないため、クラスターを正しく視覚化できません。
これは私が欲しいもののおもちゃのサンプルですが、私のデータでは、クラスターは水平方向にのみ機能します (したがって、y に対してのみクラスター化または視覚化する必要があると思います)。
r - Rのクラスタからnewickファイルを作成するには?
以下のこのスクリプトは、巨大なデータ セットを含むクラスターを取得するために適切に実行されますが、R から他の編集プログラムにエクスポートできるように、クラスターを newick ファイルまたはテキスト ファイルに取得する必要がありますが、方法が見つかりません。 hclust を newick 形式に変換するにはどうすればよいですか? 私は new2phylo 関数が仕事をするかもしれないと感じていますが、私たちはそれをうまく機能させることができませんでした.
あらゆる場所を検索しましたが、解決策が見つからないため、ご協力をお願いいたします =(
r - 距離行列 256x256 を指定したクラスタリング
したがって、256 個のオブジェクトがあり、それらの間の距離行列 (ペアごとの距離) を計算しました。私の距離行列のサブセットを以下に示します。
ここで、この距離マトリックスを使用して、これらの 256 個のオブジェクトを適切にクラスター化します。したがって、hclust を使用しましたが、エラーが発生しました。
したがって、マトリックスのより小さなサブセットを使用しても、同じエラーが発生します。
私の分析の何が問題なのですか?
r - R の水平樹状図のクラスターの周りのツリー カットと四角形
R
クラスターを識別する長方形を使用して、階層的クラスタリングの結果をデンドログラムとしてプロットしようとしています。
次のコードは、垂直樹状図のトリックを実行しますが、水平樹状図 ( horiz=TRUE
) の場合、長方形は描画されません。水平デンドログラムでも同じことを行う方法はありますか。
さらに、希望の距離値で木を切るための線をプロットしたいと思います。Rでそれをプロットする方法.cutree
関数はクラスターを返しますが、それをプロットすることも可能です.
私が探している望ましい出力はこのようなものです。
Rでこれを行うにはどうすればよいですか?
r - 個別のデンドログラムとしてのデータセットのサブセットですが、同じプロットにあります
次のように樹形図をプロットできることを知っています
ただし、いくつかのグループが特定されています (たとえば、反復分類法によって)。d
すべてのデンドログラムを同じスケールで同じプロットにまとめてプロットしようとしています。メンバーが 1 人だけのグループもプロットする必要があります。(グループ 6 および 7)
グループ内のメンバーの数が 1 つだけの場合を除いて、データのサブセットに対して個々のデンドログラムをプロットできます。しかし、私はこれが正しいアプローチだとは思いません。
ループは、最後の 2 つのグループに対してこのエラーを出しています。(6 と 7) メンバーが 1 つしかありません。
基本的に、この種のプロットを再現したくありません。メンバーが 1 つのクラスターもここにプロットされます。
r - Rのheatmap.2でデンドログラムの葉ノードの数を選択する
Matlab では、dendrogram
関数の一部としてプロットする樹状図のノード数を指定できますdendrogram(tree,P)
。P リーフ ノード以下の樹状図プロットを生成します。
Rで同じことをしようとした私の試みは、heatmap2
惨めに失敗しました。stackoverflow と biostars への投稿では、使用cutree
が提案されていますが、オプションheatmap2
に関する投稿の提案に固執していRowv
ます。ここで、"TAD" は 8 列 x 831 行のデータ マトリックスです。
次のメッセージを返します。
cutree
制限されたデンドログラムをプロットするために探索する正しい道を使用していますか? これをmatlabに似た簡単な方法はありますか?
r - 最終マージの R hclust 高さ
R で hclust 関数を使用して階層的クラスタリングを実行する場合。最終的な合流の高さはどうやってわかりますか?
したがって、いくつかのRのデフォルトデータで明確にするために:
すべてのクラスタリング情報を含む変数 hc になります。
そしてデンドログラム:
樹状図でわかるように、最終的なマージは高さ > 200 (約 300) で発生します。しかし、デンドログラムはどのように知っているのでしょうか? この情報は hc.height 変数にも dendrogram1 変数にもありません。言及された最高のマージは169です。
dendrogram1 変数にこの情報が含まれていない場合、プロット関数は、300 の高さでマージが発生する必要があることをどのように認識しますか?
他のアプリケーションでこの数 (+- 300) が必要であり、プロットからそれを読み取るのはまったく非現実的であるため、私はこれを求めています。
喜んで助けてくれる人に前もって感謝します!
r - hclustを実行するために、次の類似度行列を距離行列に変換する方法は?
hclust を使用してグラフのノード (C1、C2、C3...) をクラスター化しようとしていますが、類似度メトリックはノード間のリンクの数です。
私は次のようなデータを持っています
基本的にこれは類似度マトリックスです
これは、C1 と C3 の類似度が 3 リンクである無向グラフです。このデータを適切な dist.matrix のような形式に変換する必要があります
私の類似性メトリック (2 つのノード間の #links) に基づく形式。どうすればいいですか?