問題タブ [hdbscan]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - HDBSCAN クラスター内のどのオブジェクトも確率値 > 0 を持つべきではありませんか? そして一貫性のない結果を生み出す
hdbscan を使用して、Python Jupyter ノートブックのデータセット内のクラスターを検索しています。
そのデータは次のようになります。
そしてイェーイ!すべてがうまくいくようです!
次に、いくつかの結果を確認したいので、これらの結果をデータ フレームに追加します。
しかし、待ってください。確率が 0 のクラスターのラベルが付いた行があります。クラスター内のどのオブジェクトも確率値 > 0 を持つべきではありませんか? ああ、すべての確率は 0 または 1 にすぎません。
したがって、これをJupyterノートブックで再実行します。具体的には、再実行するだけです
clusterer.labels_
との値を確認しましたclusterer.probabilities_
が、それらは異なります。これは一貫しているはずではありませんか?なぜそれらの値が変わるのでしょうか? 私が知らされていない隠された状態はありますか?しかし、今はclusterer.probabilities_
0 から 1 の間の値を持っているので、それでいいのでしょうか?
したがって、私は明らかにこの hdbscan ツールにあまり詳しくありませんが、複数回実行したときに異なる回答が得られる理由と、ラベル付き/クラスター化されたオブジェクトの確率 0 が理にかなっている理由を誰かが説明できますか?
python - HDBSCAN modula、python 3.7、windows 10 のインストール方法
データに HDBSCAN アルゴリズムを使用する必要がありますが、モジュールがインストールされていません。私はpython 3.7を使用しています。私はこの種のトリッキーなインストールにあまり慣れていません.HDBSCANのインストール方法を明確でわかりやすい方法で教えてもらえますか?
モジュールを次からダウンロードしました: https://github.com/scikit-learn-contrib/hdbscan#egg=hdbscan
解凍しました
setup.pyファイルが表示されたフォルダーでコマンド プロンプトを開きました
次のコマンドを実行しました:
python setup.py install --prefix="C:\ProgramData\Miniconda3\envs\py37_v1"
(1行で)
次のエラーが表示されます: 「Python 3.7 hdbscan との互換性がない ため」「ビルドするには Cython をインストールする必要があります」 「Cython が見つかりません!cython をインストールしてから再試行してください」