問題タブ [naivebayes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
302 参照

machine-learning - Perl / Moose での単純ベイズ計算

これは、単純ベイズ分類器を使用して、観測された特徴に関するラベルの確率を計算するために私が書いたコードです。これは、平滑化を行わずに Naive Bayes 式を計算することを目的としており、実際の確率を計算することを目的としているため、通常省略される分母を使用してください。私が抱えている問題は、(以下の) 例では、「良い」ラベルの確率が > 1 であることです。(1.30612245) 誰かがそれが何であるかを理解するのを手伝ってくれますか? これは素朴な仮定の副産物ですか?

例:

版画:

私は0の確率についてはあまり心配していませんが、良い> 1の「確率」の方が心配です。これは、古典的なナイーブベイズの定義の実装だと思います。

どうしてこれが > 1 になるのでしょうか?

0 投票する
5 に答える
58749 参照

python - 単純ベイズ分類器と NLTK を使用して scikit で k 分割交差検証を使用する方法

小さなコーパスがあり、10 倍の交差検証を使用して単純ベイズ分類器の精度を計算したいのですが、どうすればそれを行うことができますか。

0 投票する
1 に答える
2560 参照

python - scikitはトライグラム分類器に多項式の単純なベイズを使用することを学びますか?

多項式単純ベイズ分類器に関する scikit-learn のチュートリアルを見て、試してみました。

これをテキスト文書の分類に使用したいのですが、NB の問題点は、NB がその P(document|label) をすべての独立した機能 (単語) の積として扱うことです。今、私は P(document|label) = P(wordX|wordX-1,wordX-2,label) * P(wordX-1|wordX-2,wordX-3,ラベル)。

この言語モデルを実装し、これに基づいて分類を実行するように NB 分類器を拡張できるものを scikit Learn がサポートする場所はどこですか?

0 投票する
1 に答える
372 参照

python - Python の単純ベイズ

Naive Bayes コードでラプラス スムージングを実行しようとしています。70% トレーニング 30% テスト セットで 72.5% の精度が得られますが、これは少し低いです。誰かが何か間違っていると思いますか?

posおよびnegdefaultdic です。

0 投票する
3 に答える
970 参照

machine-learning - Naive Bayes を使用した分類

Naive Bayes を使用してサンプルを分類しようとしています。私のサンプル サイズは 280 万レコードで、レコードの 90% は Class Label(従属変数) = "0" で、残りは "1" です。テスト セットの分布も同じです (90% - 10%)。Naive Bayes Classifier は、テスト セット全体に「0」のラベルを付けます。この場合、どう対処すればよいですか?そのような場合に実装できる他のアルゴリズムはありますか。

0 投票する
3 に答える
3791 参照

weka - NaiveBayesMultinomial で分類のしきい値を変更したり、Weka で混同行列を手動で計算したりするにはどうすればよいですか

私はスパム フィルター マイニング プロジェクトに取り組んでおり、現在 NaiveBayesMultinomial 分類子を使用して、単語の出現頻度を数えることでスパムを非スパムから分類しています。

問題は、WEKA がデフォルトで分類のしきい値を 0.5 に設定していることです。ただし、非スパムをスパムとして誤分類することは、その逆よりも有害です。

混同行列がどのように変化するかを確認するために、WEKA の NaiveBayesMultinomial アルゴリズムのしきい値を調整したいと考えています。それが直接不可能な場合、WEKA からの出力を利用して、別のしきい値の混同行列を計算するにはどうすればよいですか?


テスト分割で評価したときのプロジェクトの現在の結果の概要は次のとおりです。

概要:

クラス別の詳細な精度:

混同マトリックス:

0 投票する
0 に答える
278 参照

naivebayes - RapidMiner で Naive Bayes の結果が生成されない

Fisher's Iris データセットの RapidMiner で Naive Bayes プロセスを実行しています。

私の主なプロセスは次のとおりです。

アイリスの取得、ロールの設定、検証

検証サブプロセスは次のとおりです。

トレーニング セット: ナイーブ ベイズ。テスト セット: モデルの適用、パフォーマンス

プロセスを実行すると、結果がありません。これまで RapidMiner でこのような問題が発生したことはなく、Google で検索したり、Stackoverflow を検索したりしても、問題について何も見つかりません。