いくつかのデータポイントがある場合:
そして、たとえば、k-means を使用してセグメント化します。結果のセグメントは、すべてのポイントがそれぞれのクラスターの重心に最も近いものではありませんか? もしそうなら、シルエット スコアが ai (クラスター内ポイントまでの平均距離) と bi (クラスター外ポイントまでの平均距離) を比較すると、スコアがマイナスになる、または bi が ai より小さいというケースはあり得ますか? ?
分類アルゴリズムが異なると、より洗練されたアルゴリズムが異なる方法でクラスター化されたり、一部のポイントが正しく割り当てられなかったりする可能性があります。しかし、これは k-means ではどのように起こるのでしょうか?