問題タブ [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - heatmap.2- エラー: Colv デンドログラムが x のサイズと一致しません
R
を使用してヒートマップを生成しています。hclust
関数を使用したところ、エラーが発生しました:
Colv dendrogram doesn't match size of x
.
以下は私のコードです。正方行列で完全に機能します。今、私の入力行列は400x2000
です。このエラーが発生する理由を教えてもらえますか?
r - クラスタ番号を一致させて元のデータに追加する
通常の方法を使用して、階層クラスタリング プロジェクトを実行しています。
そして、私が望むのは、グループ番号を元のデータの新しい列に戻すことです。単一のリスト内でのおおよその文字列一致を見てきました-r
ここのdfはドキュメントマトリックスであるため、後で取得したdf <- t(data.frame(mydata.df.scale,cutree(hc,k=10)))
のは次のようなマトリックスです
目のグループ番号は3 であるため、4 行目の新しい列に番号 3 を追加します。
この場合、1 つのドキュメントを同じグループ内の 2 つのアイテムにマップできることに注意してください。
r - クラスター分析、サンプルではなくグループ/生息地別のデンドログラム
私の問題に関連するスレッドが見つからないようです (少なくとも簡単に言えば)。
サンプル サイト (行) ごとの種 (列) のコミュニティ マトリックスがあります。最初に Bray-Curtis 変換を実行して類似度/非類似度行列 ( vegdist
) を取得し、次にhclust
行列に関数を適用しました。
私が使用したスクリプトのセクション:
すべてが完璧に機能しますが、上記の結果、127 個のブランチ (サンプル サイトごとに 1 つ) を持つデンドログラム ツリーが作成されました。127 のサンプル サイトを、これらのサイトが属する 5 つの HABITATS ごとにグループ化したいと考えています。次に、樹状図の枝は、サンプル サイトではなく、より理解できる 5 分岐 (生息地) 樹状図を示します。したがって、生息地でクラスタリングを実行し、サンプル サイトで重み付けする必要があります。
以前は PC-ORD でこの分析を実行しましたが、今回は容赦のない R で実行する必要があります。
r - R: 階層的クラスタリング
次のデータセットがあるとしましょう
次の関数は、可能なすべての列の組み合わせを作成し、最初の列を削除します
最後のステップは、列のサブセットごとに k-means クラスタリングを実行することです。これは、apply の単純なアプリケーションです (k-means モデルのそれぞれに 3 つのクラスターが必要です)。
私の質問は、列のサブセットごとに、kmeans の代わりに階層クラスタリングを実行する方法です。何か案が?
r - hcpc 関数と hclust 関数は混合分類で異なる結果を与える
「hclust」を使用して、混合データの階層分類を開始しました。ただし、結果には、各クラスターの変数の重要性に関する詳細は含まれていません。そのため、これらすべての詳細を示す「HCPC」を使用して分類を行いました。
私の質問は次のとおりです。2 つの階層分類の結果が異なるのはなぜですか。(たとえば、最初の分類では、最初のクラスターに 881 人の個人がいますが、2 番目の分類の最初のクラスターには 679 人の個人がいます)
どんな助けでも大歓迎です!
ご多幸をお祈り申し上げます、Tang'
r - R 樹状図を最小サイズのグループにカット
特定の最小サイズのグループ化を生成するh
inの最小値を計算する簡単な方法はありますか?cut
この例では、それぞれ少なくとも 10 個のメンバーを持つクラスターが必要な場合は、次のようにする必要がありh = 3.80
ます。
分割の高さは で与えられているので、hc$height
を使用して候補値のセットを作成し、hc$height + 0.00001
それぞれのカットをループすることができます。members
ただし、クラスからクラスター サイズを解析する方法がわかりませんdendrogram
。たとえば、必要に応じて 66 ではなくをcut(as.dendrogram(hc), h=3.80)$lower[[1]]$members
返します。NULL
これは、パッケージを使用するRで最小クラスターサイズのnツリーにデンドログラムをカットするよりも簡単な質問であることに注意してくださいdynamicTreeCut
。ここでは、ツリーの数を指定していません。最小クラスター サイズのみを指定しています。TYVM。
r - hclust で類似度行列を使用する方法
ノード間の類似性を表すマトリックスがありますが、hclust
非類似性マトリックスを取るメソッドでどのように使用できますか?
非類似度を +1 に設定し、類似度を負の値に設定すると、問題は解決しますか? 例えば...
r - PPI (タンパク質タンパク質相互作用) ネットワークのクラスタリング
タンパク質相互作用データベースをサブクラスターにクラスター化したいのですが、そのためにRで階層型クラスター化を使用しましたが、理解できず、クラスターが作成されないという警告メッセージが表示されます。私のコードとデータベースは次のとおりです。
データベース:
ここで traA は trpB とやり取りし、serB は sdaA とやり取りします...今、それらをクラスター化したいと思います。私のコードは次のとおりです。
警告が表示されました: 警告メッセージ: In dist(data_frame, method = "euclidean") : 強制によって導入された NA
誰でも助けることができますか?また、PPI をクラスタリングするための他の手法について教えてください。ここで K 平均クラスタリングを使用できますか? はいの場合、どのように??? 助けてください..
ありがとう...