問題タブ [hierarchical-clustering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
postgresql - postgresql: 階層ツリーの実装
1000以上のマーカー(Googleマップに配置する必要があります)を使用したマーカークラスタリングの問題に苦労しています。私は、すべてのマーカーを使用して大きな JSON 構造をレンダリングすることにあまり熱心ではありません。また、PostGIS を使用した複雑なサーバーの「地理」計算も好きではありません。
私が思いついた解決策は、世界地図をある種の階層空間ツリー、たとえばquad treeに分割することです。ここでは、データベースの各ポイントにそのツリーの「座標」が割り当てられます。これらの座標はon position_x index_of_tile in tier_x
、「031232320012」などの文字列です。文字列の長さは、フロントエンド マップで有効になるズーム レベルの数によって異なります。基本的に、ユーザーがマップを移動またはズームした場合、現在のズーム レベルとビュー ポートの座標をパラメーターとして Ajax GET リクエストを起動します。次に、バックエンドで、「指定されたズーム レベルのビューポート」を指す文字列を作成する予定です。 .
編集:高速の GROUP BY も必要になります。SELECT count(*) from points GROUP BY left(coordinates, 5);
私の質問は、これらの操作をできるだけ速く実行する方法ですか? 私のデータベースは PostgreSQL です。
r - 階層的クラスタリングのためのカテゴリデータの準備
R を使用して、次のようなデータの階層的クラスタリングを実行したいと考えています。
これは、L2 が機能 W1 を L1 と L3 の両方と共有し、機能 W2 が L1 と L3 に存在するが、値が異なり、L2 には存在しないことを意味すると考えられます。(編集L は言語、W はこれらの言語の単語の語幹であり、値 (p、r など) は、これらの単語が特定の言語でどのように派生するかを示しています。異なる言語は共通の起源を示唆するかもしれません. それが欠けている場合, それは明確ではありません: それは何かを意味しているかもしれません, または私の情報源が不完全であるかもしれません.ステムがそれらに存在し、それらがどのように動作するか. end edit )
このデータを変換して分類を実行できるようにする方法を説明し、どの類似性指標を使用すべきかアドバイスしていただけますか?
python - 距離行列に基づく単語のクラスタリング
私の目的は、テキスト文書のコーパスに関して単語がどれだけ類似しているかに基づいて単語をクラスター化することです。すべての単語のペア間で Jaccard 類似度を計算しました。言い換えれば、私は私と一緒に利用できる疎距離行列を持っています。距離行列を入力として受け取るクラスタリング アルゴリズム (およびおそらく Python のライブラリ) を教えてもらえますか? また、クラスターの数も事前にわかりません。これらの単語をクラスター化し、どの単語がクラスター化されているかを取得したいだけです。
cluster-analysis - Cluster 3.0 での階層クラスター分析
私はこのサイトもクラスター分析も初めてなので、規約に違反していたら申し訳ありません。
Cluster 3.0 を使用して、ユークリッド距離と平均リンケージを使用した階層クラスター分析を実行しています。クラスター 3.0 は、遺伝子とそれらの類似性スコアを結合するノードを含む .gtr ファイルを出力します。.gtr ファイルの最初の行は、常に遺伝子を別の遺伝子にリンクし、その後に類似性スコアが続くことに気付きました。しかし、この類似性スコアを再現するにはどうすればよいでしょうか?
私のデータ セットには 8 つの遺伝子があり、d_{ij} に遺伝子 i と遺伝子 j の間のユークリッド距離が含まれる距離行列を作成します。次に、各要素をマトリックスの最大値で割って、マトリックスを正規化します。類似性マトリックスを取得するために、1 からすべての要素を減算します。ただし、結果はリンケージ タイプを使用せず、出力類似性スコアとは異なります。
私は主に、連鎖が最初のノードの類似性 (2 つの最も近い遺伝子の結合) にどのように影響するか、および類似性スコアを計算する方法について混乱しています。
ありがとうございました!
python - scipy.cluster.hierarchy によって作成されたデンドログラムのサブツリーを取得するにはどうすればよいですか
このモジュール (scipy.cluster.hierarchy) に関して混乱がありました...そしてまだいくつかあります!
たとえば、次のデンドログラムがあります。
私の質問は、色付きのサブツリー (それぞれがクラスターを表す) を適切な形式 (SIF 形式など) で抽出するにはどうすればよいですか? 上記のプロットを取得するコードは次のとおりです。
したがって、 の出力はfcluster()
(ID による) ノードのクラスタリングを提供し、ここleaders()
で説明されているのは 2 つの配列を返すことになっています。
最初のものには、Z によって生成されたクラスターのリーダー ノードが含まれています。ここでは、プロットと同様に 5 つのクラスターがあることがわかります。
2 つ目はこれらのクラスターの ID です
したがって、この Leaders() が resp を返す場合。L および M :L[2]=182
およびM[2]=1
の場合、クラスター 1 はノード ID 182 によって導かれますが、これは観測セット X には存在しません。ドキュメントには、「... その後、非シングルトン クラスターに対応する」と記載されています。しかし、私はそれを得ることができません...
また、Z を によってツリーに変換しました。これによりsch.to_tree(Z)
、使いやすいツリー オブジェクトが返されます。これを視覚化したいのですが、これらの種類のツリー オブジェクトを入力として操作するグラフィカル プラットフォームとしてどのツールを使用すればよいでしょうか?
r - 各クラスタのクラスタ割り当てを表示する方法
Rでcutreeステップの後にクラスター内のメンバーを表示する方法はありますか? 例えば:
私は次のように取得します:
次のようなより簡単な方法で表示/印刷したい:
どうすればいいですか?ありがとう!
matlab - データポイントの順序を保持する凝集クラスタリングアルゴリズム?
データ ポイントの順序を保持する階層的クラスタリングの実装 (できれば matlab で) が必要です。たとえば、このようなものを出力したくない
これにはもっと適切な用語があると確信しています。入力と同じ順序でクラスターが互いに近くにあることを組み合わせるために必要なだけです。