-1

アイテム i1、...、iN があるとします

次のような方法でそれらをクラスター化したいと思います。

  1. クラスターを何回も実行した場合、項目 iJ と iK が同じクラスターになる可能性は高くなります。
  2. クラスター数とクラスター メンバーシップは、クラスター シードに関係なく比較的安定しています。

これを達成するためのよく知られたアルゴリズムはありますか?

説明:

3 つのクラスターが必要だと言って、次のように言います。

  • 実際には-1 クラスター c1 c2 c3 のシードとして i1、i33、i89 から始めます
  • 実際には-2 クラスタ c1 c2 c3 のシードとして i44、i55、i77 から始めます

両方の現実の結果のクラスターがほぼ同じになるようにしたい

4

2 に答える 2

2

階層的クラスタリングアルゴリズムがニーズを満たすと思います。

  1. クラスターの一貫性は同じセットに対して保証されており、アイテム iJ と iK が同じクラスターになる確率は 1 です。
  2. 種はありません。ツリーを分析するか、既存のカットオフアルゴリズムを使用して、適切な数のクラスターを選択します (それらはたくさんあります)。

[編集]

実際、階層的クラスタリングだけでなく、どの決定論的クラスタリング アルゴリズムにもこれらの機能があります。

于 2013-10-11T19:25:15.427 に答える
1

初期化に関してアルゴリズムをより堅牢にするためによく見られる戦略は、それをブートストラップすることです。たとえば、この論文を参照してください。

もう 1 つのオプションは、事前にデータを並べ替え、厳密に決定論的なアルゴリズムを使用することです。

于 2013-10-11T19:28:41.110 に答える