ELKI環境でのOPTICS実装の使用に問題があります。私はDBSCANの実装に同じデータを使用しましたが、それは魅力のように機能しました。おそらく私はパラメータで何かが欠けていますが、それを理解することはできません、すべてが正しいようです。
データは単純な300х2行列であり、それぞれに100ポイントを持つ3つのクラスターで構成されます。
DBSCANの結果:
MinPts = 10、Eps = 1
光学結果:
MinPts = 10
ELKI環境でのOPTICS実装の使用に問題があります。私はDBSCANの実装に同じデータを使用しましたが、それは魅力のように機能しました。おそらく私はパラメータで何かが欠けていますが、それを理解することはできません、すべてが正しいようです。
データは単純な300х2行列であり、それぞれに100ポイントを持つ3つのクラスターで構成されます。
DBSCANの結果:
MinPts = 10、Eps = 1
光学結果:
MinPts = 10
@AnonyMousseはほとんどそれを正しくしました。まだ賛成もコメントもできません。
将来的には、小規模な学生プロジェクトとして、一部の学生に他のクラスター抽出方法を提供してもらいたいと考えています。これらは私たちの研究に不可欠ではありませんが、ELKIについて学びたい学生にとっては良い仕事です。
ELKIは動きの速いプロジェクトであり、コミュニティの貢献から生まれています。いくつかのコードを提供していただければ幸いです。コードベースを使い始めるのは簡単ではないことはわかっています。コードベースはかなり大きく、実装の一般性とインデックス構造のサポートにより、始めるのが少し難しくなっています。私たちはあなたが始めるのを助けるためにチュートリアルを追加しようとします。そして、慣れれば、実際にアーキテクチャの恩恵を受けることができます。アルゴリズムは、インデックス付けと任意の距離関数のメリットを享受しますが、最初から実装する場合は、ユークリッド距離のみをサポートし、インデックスアクセラレーションはサポートしない可能性があります。
あなたがOPTICSに苦労しているのを見て、私は新年にOPTICSチュートリアルを書こうと思います。特に、OPTICSは、適切なインデックス構造を使用することで多くのメリットを得ることができます。
あなたはすでに自分で解決策を見つけたようですが、ここに長い話があります:
OPTICS
ELKIのクラスは、クラスターの順序/到達可能性の図のみを計算します。
クラスターを抽出するために、さまざまな選択肢があります。そのうちの1つ(元のOPTICS出版物からのもの)はELKIで利用できます。
したがって、ELKIでクラスターを抽出するには、アルゴリズムを使用する必要があります。アルゴリズムは、クラスターの順序を計算するために、またはインデックスベースのOPTICSXi
いずれかを使用します。OPTICS
DeLiClu
これがELKIで2つの部分に分割される理由は、クラスターを抽出するための別のロジックを実装できるようDeLiClu
にするためと、クラスターの順序を計算するためのさまざまなメソッドを実装できるようにするためです。これは、ELKIのモジュラーアーキテクチャとうまく一致します。
IIRCには、ローカルの最大値を探してクラスターを抽出し、谷の端に達するまで水平方向に拡張する方法が少なくとももう1つあります(明らかにまだELKIにはありません)。そして、プロットの「変曲点」を使用した別のものがありました。