問題タブ [hierarchical-clustering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - コミュニティ情報をグラフに保持する方法
私は、Neo4j で保持しているいくつかのグラフ データベース (友人ネットワーク、購入履歴など) を持っています。Girvan Newmanなどのコミュニティ検出アルゴリズムを使用してこれらを分析する予定です。これらのアルゴリズムは通常、ネットワーク全体から個々のノードへのグラフの分割を表すデンドログラムを返します。これらの結果をどのように維持できるか疑問に思っています。別のグラフとして保存できると思いますが、グラフ自体に保存する方法はありますか? そうする際の私の懸念は、グループを表すノードを作成する必要があることです。これは避けたいことです。
matlab - clusterdata Matlab 関数
Matlab の clusterdata 関数を使用して、データ (ノイズと非ノイズ) をノイズ グループと非ノイズ グループの 2 つのカテゴリに分類しています。この関数は、すべてのノイズ データにグループ 1、すべての非ノイズ データにグループ 2 という名前を付けることを除けば、うまく機能します。すべてのノイズ データにグループ 2、すべての非ノイズ データにグループ 1 という名前を付けることもあります。
どうすれば制御できますか?つまり、すべてのノイズ データをグループ 1 としてラベル付けします。
matlab - MatlabまたはRで重複クラスタ分析を行うには?
サイズが 20 × 300 のバイナリ マトリックスがあります。20 個の変数を 5 つまたは 6 つのグループにクラスター化したいと考えています。これまでのところ、matlab でさまざまな距離メトリックを使用して kmeans と階層的クラスタリング アルゴリズムを使用しましたが、どちらも重複しないクラスターを提供してくれました。私のデータを見ると、一部の変数は複数のグループに配置する必要があります。matlab または R で重複するクラスターを実行する方法があるかどうかは誰にもわかりませんか? どんな助けでも大歓迎です。前もって感謝します!
python - SciPyの階層的凝集クラスタリングから重心を取得するには?
SciPy の階層的凝集クラスタリング メソッドを使用して、機能の amxn マトリックスをクラスタリングしていますが、クラスタリングが完了した後、結果のクラスタから重心を取得する方法がわかりません。以下は私のコードに従います:
特徴のマトリックスを取得し、それらの間のユークリッド距離を計算してから、それらを階層的クラスタリング メソッドに渡します。そこから、最大 100 クラスターのフラット クラスターを作成しています。
では、フラット クラスター T に基づいて、各フラット クラスターを表す 1 xn セントロイドを取得するにはどうすればよいでしょうか?
r - Rでの階層的クラスタリングの奇妙なエラー
私のRプログラムは以下の通りです:
私の入力は距離行列です(もちろん対称です)。距離行列が約数千レコード(数百レコードは何も起こらない)より大きい上記のプログラムを実行すると、エラーメッセージが表示されます。
私のマシンには約16GBのRAMと4CPUがあるので、リソースの問題にはなりません。
誰かが私に何が問題なのか教えてもらえますか?ありがとう!!
python - scipy階層的クラスタリングを機能させることができません
単純なテストデータセットで階層的クラスタリングを行うことを目的とした単純なスクリプトを作成しました。
関数fclusterdataは、データを2つのクラスターにクラスター化する候補であることがわかりました。データセットとしきい値の2つの必須の呼び出しパラメーターが必要です。問題は、予想される2つのクラスターを生成するしきい値が見つからなかったことです。
誰かが私が間違っていることを教えてくれたら嬉しいです。また、クラスタリングに適した他のアプローチを誰かが指摘できれば幸いです(事前にクラスターの数を指定することは避けたいと思います)。
これが私のコードです:
出力は次のとおりです。
r - 置換とクラスタリングを使用した行列の列の並べ替え
Rを置き換えて行列の列を並べ替えるにはどうすればよいですか?rmperm {sna}という関数を見つけましたが、列と行の両方を並べ替えますが、列を並べ替えたいだけです。
編集:行列を1000回並べ替えてから階層的クラスタリングを実行する必要があるため、1000回のランダム化後に最終的なツリーが作成されます。
どうもありがとう。
r - ランダム化と階層ツリー
データマトリックスを1000回並べ替え(列単位のみ)、「R」で階層クラスタリングを実行しようとしているため、1000回のランダム化後にデータに最終的なツリーが作成されます。これは私が迷っているところです。私はこのループを持っています
最終的なツリーが 1000 回のランダム化の後の積なのか、それともループで計算された最後のツリーなのかはわかりません。また、ツリーにブートストラップ値を表示したい場合、どうすればよいですか?
どうもありがとう!!
algorithm - クラスタリング アルゴリズムをテストする最良の方法
クラスタリング アルゴリズムをテストする最良の方法は何ですか? 停止基準を持つ凝集クラスタリング アルゴリズムを使用しています。クラスターが正しく形成されているかどうかをテストするにはどうすればよいですか?