0

scipy のdendrogramドキュメントには次のように書かれています。

dendrogram(Z, ...)
    The dendrogram illustrates how each cluster is
    composed by drawing a U-shaped link between a non-singleton
    cluster and its children. ...It is expected that the distances in Z[:,2] be
    monotonic, otherwise crossings appear in the dendrogram.

「Z[:,2] の距離は単調であることが予想されます。それ以外の場合、交差がデンドログラムに表示されます」という文については不明です。図中のどの交差点が参照されていますか? 誰かが特定の距離行列でこれが発生する例を理由の説明とともに示してもらえますか?

これは交差点の例ですか?これは、距離行列のいくつかの対称性によって発生するように思えます... ここに画像の説明を入力

4

1 に答える 1

1

Zは、クラスターのマージ(2つのクラスターがマージされる)とそれらが発生する「時間」を指定することになっています。ここで、「時間」は樹状図のy軸です(これは距離の意味です)。Z は通常、「時間」が昇順になるように構築されます。これにより、U 形状が互いに重ならないようにプロットすることも容易になります。U を別の順序でプロットすると、それらが重なり合って乱雑に見えることがあります。これがクロッシングと呼ばれるものです。

簡単な例を実行しました。これは、交差点がどのように見えるかの例です。

ここに画像の説明を入力

結論: 正しい順序を守りましょう。

于 2013-04-11T14:40:33.613 に答える