はい:
クラスターをドメインの専門家に渡して、アルゴリズムが見つけた構造が適切かどうかを分析してもらいます。それが新しいかどうかはそれほどではありませんが、それが賢明であれば。
...そして いいえ:
公正な自動評価はありません。教師なしクラスタリングの目的を考慮しているという意味で:知識の発見、別名: データについて何か新しいことを学びます。
クラスタリングを自動的に評価するには、次の 2 つの一般的な方法があります。
内部結束。つまり、最小化するクラスター間分散と比較したクラスター内分散などの特定のプロパティがあります。問題は、チートをするのはたいてい簡単なことだということです。つまり、スコアが非常に高い簡単なソリューションを構築することです。したがって、この方法を、異なる仮定に基づく方法の比較に使用してはなりません。階層クラスタリングのさまざまなタイプのリンケージを公平に比較することさえできません。
外部評価。ラベル付けされたデータ セットを使用し、アルゴリズムが既存の知識をどの程度再発見したかによってスコアを付けます。これは非常にうまく機能する場合もあるため、評価のための最先端技術として受け入れられています。それでも、もちろん、教師ありまたは半教師ありの方法は、これではるかに優れたスコアを獲得します. そのため、A)監視された方法に偏っており、B) まだ知らなかったものを見つけるという知識発見のアイデアに実際には完全に反しています。
クラスタリングを実際に使用する場合 (つまり、データについて何かを学ぶ場合) は、できればドメイン エキスパートなどの完全に独立した方法で、ある時点でクラスタを検査する必要があります。たとえば、クラスタリングによって識別されたユーザー グループは、まだ詳細に調査されていない重要なグループであると彼が言うことができれば、あなたは勝者です。
ただし、残念ながら、ほとんどの人は「ワンクリック」 (および 1 点) の評価を望んでいます。
ああ、「クラスタリング」は実際には機械学習のタスクではありません。実際には学習は含まれていません。機械学習コミュニティにとって、誰も気にかけない醜いアヒルの子です。