DBSCAN では、コア ポイントは、Eps 内に MinPts を超えるものとして定義されます。
したがって、MinPts = 4 の場合、Eps で合計 5 ポイントのポイントは間違いなくコア ポイントです。Epsで4点(自分も含めて)ある点はどうですか?コアポイントですか、境界ポイントですか?
DBSCAN では、コア ポイントは、Eps 内に MinPts を超えるものとして定義されます。
したがって、MinPts = 4 の場合、Eps で合計 5 ポイントのポイントは間違いなくコア ポイントです。Epsで4点(自分も含めて)ある点はどうですか?コアポイントですか、境界ポイントですか?
境界点は、(DBSCAN では)クラスターの一部ですが、それ自体は密集していません(つまり、コア ポイントではないすべてのクラスター メンバー)。
フォローアップ アルゴリズム HDBSCAN では、境界点の概念が破棄されました。
カンペッロ、RJGB; Moulavi、D。サンダー、J . (2013)。
階層密度推定に基づく密度ベースのクラスタリング。
データベースにおける知識発見に関する第 17 回太平洋アジア会議の議事録、PAKDD 2013。コンピュータ サイエンス 7819 の講義ノート。160. doi:10.1007/978-3-642-37456-2_14
どの州:
私たちの新しい定義は、密度のレベル セットの連結成分 [...] 境界オブジェクトが技術的にレベル セットに属していないため、クラスターの統計的解釈とより一致しています (それらの推定密度はしきい値を下回っています)。
実際、元の論文を読み直したところ、定義 1 により、コア ポイントが独自の eps 近傍に属しているように見えます。したがって、minPts が 4 の場合、点はその eps 近傍に少なくとも 3 つの他の点を必要とします。
定義 1 で、NEps(p) = {q ∈D | dist(p,q) ≤ Eps}。ポイントがその eps 近傍から除外された場合、NEps(p) = {q ∈D | dist(p,q) ≤ Eps および p != q}. != は「等しくない」です。
これは、図 4 の OPTICS 論文で DBSCAN の著者によっても補強されています。http://fogo.dbs.ifi.lmu.de/Publikationen/Papers/OPTICS.pdf
したがって、SciKit の解釈は正しく、Wikipedia の図はhttp://en.wikipedia.org/wiki/DBSCANで誤解を招くと思います