問題タブ [r-daisy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
7211 参照

r - データが欠落している R でのクラスター分析

そのため、これを行う方法についての答えを見つけるのにかなりの時間を費やしました。これまでに見つけた唯一の答えは次のとおりです。RにNAが存在する行を削除せずにクラスタリングを実行する方法

残念ながら、これは私にとってはうまくいきません。

これが私のデータの例です(この例では d ):

これが私が試したものです:

私の理解では、デイジーは NA 値を処理できるはずですが、結果をクラスター化しようとするとエラーが発生します。

ありがとう。

0 投票する
0 に答える
530 参照

r - 2Gb を超えるベクトルを割り当てる方法

このエラーを受け取ったとき、R でコマンドを実行しようとしていました。

R により多くのメモリを割り当てる方法はありますか? 私のはWindows上の64ビットRです。ありがとう!

0 投票する
0 に答える
528 参照

r - R のヒートマップから特定のオブジェクト/行を選択する

クラスター アルゴリズムを適用する予定の数値属性とカテゴリ属性を含むデータ型が混在しています。

最初のステップとして、daisy() 関数と Gower 距離測定を使用して距離行列を作成しました。R でヒートマップとレベルプロット関数を使用して距離行列を表示しました。

データ内の一部のオブジェクト間に強い類似性があるように思われます。類似/非類似のオブジェクトのいくつかをチェックして、自分のデータでメジャーが適切に機能していることを確認したいと考えています。

ヒートマップから類似/非類似のオブジェクトを選択し、それらを元のデータ セットにリンクして評価できるようにするにはどうすればよいですか?

これは、R を使用してヒートマップをプロットする方法です。IDX は距離マトリックスです。

0 投票する
1 に答える
2778 参照

r - 非類似度行列 R を使用した階層型クラスター

数値属性とカテゴリ属性を含むデータ型マトリックスData_stringサイズ (947 x 41) が混在しています。

daisy() 関数と Rstudio の Gower 距離測定を使用して、距離行列 (947 x 947) を作成しました。

非類似度行列 (d) を使用して階層型クラスターを適用しました。

以下は私が持っていたプロットです。

ダイアナ_プロット

hclust_plot

** 注: 評判のポイントが不足しているため、ここに画像をアップロードできませんでした。

私は結果を理解するのに苦労しています、誰かお願いします

1-結果の理解を簡素化するためにRに適用できる解決策を提案してください。

また

2-すべての結果は非類似度マトリックスに基づいているため、それをソースデータにリンクする方法。

0 投票する
1 に答える
3593 参照

r - デイジーを使用したクラスター分析

パッケージを使用して、RStudio で階層クラスター分析を実行しようとしていますdaisy。これは私のデータセットです:

でユークリッド距離を使用したいのですがdaisy、実行すると

出力がうまくいきません。ユークリッド距離の代わりにガワー距離が使用されます。

警告メッセージ:In daisy(fuu, metric = c("euclidean"), type = list(ordratio = c(1,:with mixed variables, metric "gower" is used automatically)

どうすれば修正できますか?

0 投票する
0 に答える
183 参照

r - hclus.scree を使用した Elbow メソッド、エラーで関数が見つかりませんでした

関数「hclus.scree」を使用してエルボー法を使用してクラスターの数を特定するドキュメントをいくつか見つけました。ただし、R は hclus.scree 関数を見つけることができません。これはRのもののバージョンですか?複数のライブラリを試しましたが、まだ重要なライブラリが不足している可能性があります。

library(cluster) DissimDaisy <- daisy(TraitData, metric = "gower") AveClust <- hclust(DissimDaisy, method = "average", members = NULL) hclus.scree(AveClust) エラー: 関数 "hclus.scree が見つかりませんでした" "

0 投票する
1 に答える
5088 参照

r - R の加重ユークリッド距離

データ フレームから加重ユークリッド距離を使用して距離行列を作成したいと思います。重みはベクトルで定義されます。次に例を示します。

私はどこでも検索しましたが、R でこれに対するパッケージまたはソリューションを見つけることができません。通常のユークリッド。距離。

スタックオーバーフローのアイデアはありますか?

0 投票する
1 に答える
2425 参照

r - R - gower.dist と daisy(...,metric="gower") の異なる結果

観測ごとに最も近いクラスターを見つけるために、2 つのデータ フレームの行間の距離 (非類似度) を計算したいと考えています。因子と数値変数があるため、ガワー距離を使用しています。2 つのデータ フレームを比較したいので (1 つの行列の行間の非類似性ではなく)、 gower.dist が必要な関数になります。しかし、実装してみると、デイジーのガウアーを使用して行を結合し、非類似度行列の関心のある部分を調べた場合とは結果が異なることに気付きました。

ここではデータのサンプルのみを提供しますが、すべてのデータで非類似度を計算すると、対応する行が互いに等しくなくても、gower.dist の非類似度がゼロになることがよくありました。なんで?そして、異なる結果の理由は何でしょうか? 私の意見では、daisys の gower は正しく機能していますが、gower.dist はそうではありません (この例では)。

次のデータで

ありがとうございました!

編集:数値列に NA があり、それらの処理が異なるように見えるため、エラー/違いが発生したようです。daisy の NA の扱いを gower.dist に適応させるにはどうすればよいですか?