問題タブ [hdbscan]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
298 参照

python - HDBSCAN クラスター内のどのオブジェクトも確率値 > 0 を持つべきではありませんか? そして一貫性のない結果を生み出す

hdbscan を使用して、Python Jupyter ノートブックのデータセット内のクラスターを検索しています。

そのデータは次のようになります。

データ

そしてイェーイ!すべてがうまくいくようです!

次に、いくつかの結果を確認したいので、これらの結果をデータ フレームに追加します。

しかし、待ってください。確率が 0 のクラスターのラベルが付いた行があります。クラスター内のどのオブジェクトも確率値 > 0 を持つべきではありませんか? ああ、すべての確率は 0 または 1 にすぎません。

したがって、これをJupyterノートブックで再実行します。具体的には、再実行するだけです

clusterer.labels_との値を確認しましたclusterer.probabilities_が、それらは異なります。これは一貫しているはずではありませんか?なぜそれらの値が変わるのでしょうか? 私が知らされていない隠された状態はありますか?しかし、今はclusterer.probabilities_0 から 1 の間の値を持っているので、それでいいのでしょうか?

したがって、私は明らかにこの hdbscan ツールにあまり詳しくありませんが、複数回実行したときに異なる回答が得られる理由と、ラベル付き/クラスター化されたオブジェクトの確率 0 が理にかなっている理由を誰かが説明できますか?

0 投票する
1 に答える
1871 参照

python - HDBSCAN modula、python 3.7、windows 10 のインストール方法

データに HDBSCAN アルゴリズムを使用する必要がありますが、モジュールがインストールされていません。私はpython 3.7を使用しています。私はこの種のトリッキーなインストールにあまり慣れていません.HDBSCANのインストール方法を明確でわかりやすい方法で教えてもらえますか?

  • モジュールを次からダウンロードしました: https://github.com/scikit-learn-contrib/hdbscan#egg=hdbscan

  • 解凍しました

  • setup.pyファイルが表示されたフォルダーでコマンド プロンプトを開きました

  • 次のコマンドを実行しました:python setup.py install --prefix="C:\ProgramData\Miniconda3\envs\py37_v1"(1行で)

次のエラーが表示されます: 「Python 3.7 hdbscan との互換性がない ため」「ビルドするには Cython をインストールする必要があります」 「Cython が見つかりません!cython をインストールしてから再試行してください」