問題タブ [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 大規模なデータセットに対する R の hclust()
R で階層的クラスタリングを実装しようとしています: hclust() ; これには dist() によって作成された距離行列が必要ですが、私のデータセットには約 100 万行あり、EC2 インスタンスでさえ RAM が不足しています。回避策はありますか?
r - rでデンドログラムをカットする方法
わかりましたので、これは以前に尋ねられたと確信していますが、何時間も検索した後、どこにも良い答えが見つかりません.
いくつかのデータがあり、分類を実行してから樹形図を作成します。
問題は、特に美学に関係しています。(1) グループの数に応じてカットする方法 (この例では 3 つが必要です)、(2) グループ ラベルを木の枝に揃える、(2) 巨大にならないように再スケーリングするグループ間のギャップ
(3) の詳細。私は非常に種が豊富なデータセットを持っており、切断せずに約1000のグループがあります。たとえば 3 で切断すると、木の右側にいくつかの枝があり、右側に 1 マイル離れたところに枝があり、より近くなるように再スケーリングする必要があります。これはすべて外部プログラムを介して可能ですが、rですべてやりたいです!
- このプロットの右上にネストされた平均シルエット幅プロットを配置できる場合のボーナス ポイント
これは虹彩データを使用した例です
r - 多くのゼロを含む非常に大きなデータをプロットする
これは非常に大きなデータのごく一部です
私が欲しいのは、データにゼロがたくさんあるときに、より強調された方法で値を表示することです
私がそれをどのようにプロットするかはこのようなものです
しかし、ご覧のとおり、この小さな例では、ゼロが私のプロットを支配しており、それが非常に大きい場合、何も見ることができません。また、値の位置を変更することはできません
r - identify.hclust() を使用して切断高さを取得します
hclust
を使用して R で作成されたデンドログラムを手動でカットしていidentify.hclust
ます。関数のデフォルトの戻り値は、各グループの観測の ID です。この情報が必要ですが、このグループの身長も知る必要があります。それを行う方法はありますか?どうもありがとう!
再現可能なデータ:
例として、次の高さでデンドログラムをカットしidentify
、ブランチのマージの高さを取得したいと考えています。