問題タブ [hclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
852 参照

r - R における階層的クラスタリング - 「pvclust」の問題

pvclust で問題が発生した再現可能な例を作成しました。私の目標は、階層クラスター樹状図で理想的なクラスターを選択することです。「pvclust」のことは聞いたことがありますが、使い方がわかりません。また、理想的なクラスターを決定するために、これ以外に他の提案があれば、それは本当に役に立ちます。

私のコードが提供されています。

次のようなエラーが表示されました。

0 投票する
2 に答える
1407 参照

r - 共起に基づくクラスタリング

Rを使ってco-occurrencesというキーワードでデータをクラスタリングしたいと思っています

  1. 単語の階層レベルが異なる
  2. キーワードは必ずしも順序または階層レベルで表示されるとは限りません

結果として、最初のレベルでキーワードが食品と家具に分岐するようにしたいと考えています。2 番目と 3 番目には、ベッドルーム、リビング ルームなどのサブブランチがあります。次のような階層クラスター分析を使用する場合

最下層のカテゴリの 1 つとして「家具」になりますが、私の例では「節点」です。

これを解決する機能はありますか?

ベスト・ピート

0 投票する
1 に答える
12366 参照

r - cutree を使用した hclust()...単一の hclust() で cutree() クラスターをプロットする方法

cutree() を使用して、hclust() ツリーをいくつかのグループにクラスター化しました。ここで、いくつかのグループメンバーを hclust() として hclust() する関数が必要です... また:

1 つのツリーを 168 のグループに分割し、168 個の hclust() ツリーが必要です... 私のデータは 1600*1600 の行列です。

私のデータは大きすぎるので、例を挙げます

ここで、18 本の木をプロットしたいと思います... 1 つのグループに 1 本の木です。いろいろ試しました..

0 投票する
0 に答える
420 参照

r - dist()関数を使用せずにデータフレーム要素間の距離をR-計算する

大規模なデータセット (〜 188000 行) があります。行間の距離を計算したいので、関数を適用しhclustてデータセットの中心を決定し、後でkmeans関数を適用してデータを分類できます。

私の問題は、マトリックス距離を計算する最初のステップにあります。distパッケージの関数を使用すると、次のstatsエラーが発生しました。

RAMの問題であることは明らかです。

距離行列を計算する別の方法を見つける必要があります。

明確な答えは私にとってとても役に立ちます。

0 投票する
1 に答える
729 参照

r - R で hclust を使用したクラスター属性

列名を属性とし、行を項目とする 2 次元データのデータ セットがあります。以下にサンプルを示します。

....

R でクラスター樹形図を作成するために hclust (ward.D2 メソッド) を使用しました。クラスター内のすべてのアイテムのラベルを取得できます。クラスターの属性 (A1 A2 など) のリストを見つけて、それらのアイテムがどのように組み合わされたかを推測するにはどうすればよいですか?

私が試したコードは次のとおりです。

0 投票する
1 に答える
234 参照

r - R - hclust で特定の特性を持つクラスターを分離する

hclust を使用して一部のデータのクラスター樹形図を生成しましたが、すべての対になったクラスター、つまり 2 つのデータ (一緒にクラスター化される最初のデータ) のみを構成するすべてのクラスターを分離する必要があります。 「より高い」ブランチ上の他のデータとクラスター化されています。どうすればそれができるか知っている人はいますか?

添付の画像で分離したいクラスターを強調表示しましたが、うまく説明できれば幸いです。

デンドログラム

クラスターの内容を比較できるように、それらのクラスター内のすべての対になったデータを分離できるようにしたいと考えています。たとえば、特定のタイプのデータが含まれているものを確認します。

0 投票する
2 に答える
131 参照

r - クラスタリングの視覚化/分析のための座標プロット

合計 8 列で構成されるデータセット (スケーリング済み) があります。

  • 各観測が属する割り当てられたクラスターを示す最初の列、
  • および、7 つの従属変数 (それぞれ異なる列にあります)。

次のブログ ( http://blog.datascienceheroes.com/short-lesson-on-cluster-analysis/ )に示されているように、R の座標プロットを使用してクラスタリングの視覚化を開発したいと考えています。

誰でもこれで私を助けることができますか?