0

http://www.mathworks.com/help/stats/hierarchical-clustering.html?s_tid=doc_12bのドキュメントに従って、階層的クラスタリングを実装しました。

だから、私がやろうとしていることを書き留めてみましょう。次の図を見てください。

デンドグラム

現在、この樹状図は次のデータから生成されています。

                         node1        node2         dist(node1,node2)   num_elems
assigning index  **37  to  [ 16.          26**.           1.14749118   2.        ]
assigning index  38  to  [ 4.          7.          1.20402602  2.        ]
assigning index  39  to  [ 13.          29.           1.44708015   2.        ]
assigning index  40  to  [ 12.          18.           1.45827365   2.        ]
assigning index  41  to  [ 10.          34.           1.49607538   2.        ]
assigning index  42  to  [ 17.          38.           1.52565922   3.        ]
assigning index  43  to  [  8.          25.           1.58919037   2.        ]
assigning index  44  to  [  3.          40.           1.60231007   3.        ]
assigning index  45  to  [  6.          42.           1.65755731   4.        ]
assigning index  46  to  [ 15.          23.           1.77770844   2.        ]
assigning index  47  to  [ 24.          33.           1.77771082   2.        ]
assigning index  48  to  [ 20.          35.           1.81301111   2.        ]
assigning index  49  to  [ 19.         48.          1.9191061   3.       ]
assigning index  50  to  [  0.          44.           1.94238609   4.        ]
assigning index  51  to  [  2.         36.          2.0444266   2.       ]
assigning index  52  to  [ 39.          45.           2.11667375   6.        ]
assigning index  53  to  [ 32.          43.           2.17132916   3.        ]
assigning index  54  to  [ 21.         41.          2.2882061   3.       ]
assigning index  55  to  [  9.          30.           2.34492327   2.        ]
assigning index  56  to  [  5.          51.           2.38383321   3.        ]
assigning index  57  to  [ 46.          52.           2.42100025   8.        ]
assigning index  58  to  [ **28.          37**.           2.48365024   3.        ]
assigning index  59  to  [ 50.          53.           2.57305009   7.        ]
assigning index  60  to  [ 49.          57.           2.69459675  11.        ]
assigning index  61  to  [ 11.          54.           2.75669475   4.        ]
assigning index  62  to  [ 22.          27.           2.77163751   2.        ]
assigning index  63  to  [ 47.          55.           2.79303418   4.        ]
assigning index  64  to  [ 14.          60.           2.88015327  12.        ]
assigning index  65  to  [ 56.          59.           2.95413905  10.        ]
assigning index  66  to  [ 61.          65.           3.12615829  14.        ]
assigning index  67  to  [ 64.          66.           3.28846304  26.        ]
assigning index  68  to  [ 31.         58.          3.3282066   4.       ]
assigning index  69  to  [ 63.          67.           3.47397104  30.        ]
assigning index  70  to  [ 62.          68.           3.63807605   6.        ]
assigning index  71  to  [  1.          69.           4.09465969  31.        ]
assigning index  72  to  [ 70.          71.           4.74129435  37.     

つまり、基本的に、0から36までのインデックスが付けられた同じデータに37のポイントがあります。これで、このリストの最初の要素が表示されたら... i + len(thiscompletelist)+ 1を割り当てます。たとえば、idが37将来の反復で再び見られるように、それは基本的にそれがブランチにもリンクされていることを意味します。この画像を生成するためにmatlabを使用しました。しかし、私はこの情報をクエリしquery_node(node_id)て、レベルごとのリストを返すようにしたいのですquery_node(37)

{ "left": {"level":1 {"id": 28}} , "right":{"level":0 {"left" :"id":16},"right":{"id":26}}}

実際には..これを行うための正しいデータ構造が何であるかさえわかりません..基本的に、ノードごとにクエリを実行し、そのノードに立って下を見ているときに、この樹状図の構造がどのように見えるかについての洞察を得たいと思います。:(

編集1:

* OOH画像をズームできないことを知りませんでした。基本的に左から4番目の要素は28で、緑色のエントリはデータの最初の行です。

したがって、樹状図の4番目の垂直線は28を表します

その線の隣(最初の緑色の線)は16を表します

その線の隣(2番目の緑色の線)は26*を表します

4

1 に答える 1

2

さて、既存のものに基づいて構築することは常に良いことなので、scipyの樹状図を見てください。

于 2013-01-29T21:29:48.940 に答える