問題タブ [naivebayes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
classification - 単純ベイズ分類器-複数の決定
単純ベイズ分類器を使用して複数の決定を生成できるかどうかを知る必要があります。複数の決定を支持する証拠がある例は見つかりませんでした。私はこの分野に不慣れです。だから、私は少し混乱しています。
実は文字認識ソフトを開発する必要があります。そこで、与えられたキャラクターが何であるかを特定する必要があります。ベイジアン分類器は、与えられた文字が特定の文字であるかどうかを識別するために使用できるようですが、他の提案を与えることはできません。
たとえば、「3」の画像が与えられた場合(「3」だと思います)、システムがそれを「3」として識別できない場合です。システムが「2」のように見える場合、システムは「2」を返す必要があります。
単純ベイズ分類器について私が持っている考えは、データをトレーニングすると、特定の文字が特定の文字であるかどうかをシステムに尋ねることができるということです。例えば。特定の番号の画像を描画し、それが「2」であるかどうかをシステムに尋ねます。
さらに、KNN(k最近傍)が複数の決定を行うことに気づきました。それに与えられたキャラクターは、トレーニングデータで与えられた最も近い互換性のあるキャラクターを決定します。
ナイーブベイズ分類器を使用して上記のような複数の決定を行うことができるかどうかを誰かが説明してくれれば幸いです。
machine-learning - ナイーブベイズを使用したテキスト分類
NaiveBayesを使用してテキスト分類機械学習の問題を実行しています。私はそれぞれの言葉を特徴として持っています。私はそれを実装することができました、そして私は良い精度を得ています。
単語のタプルを機能として使用することはできますか?
たとえば、政治とスポーツの2つのクラスがあるとします。政府と呼ばれる言葉が両方に現れるかもしれません。ただし、政治ではタプル(政府、民主主義)を持つことができますが、クラススポーツではタプル(政府、スポーツマン)を持つことができます。したがって、政治に関する新しいテキスト記事が登場した場合、タプル(政府、民主主義)の確率はタプル(政府、スポーツマン)よりも確率が高くなります。
私はこれを行うことによって、私はナイーブベイズ問題の独立性の仮定に違反しているので、これを求めています。なぜなら、私は単一の単語も特徴として考えているからです。
また、機能に重みを付けることも考えています。たとえば、3タプルの機能は、4タプルの機能よりも重みが小さくなります。
理論的には、これら2つのアプローチは、単純ベイズ分類器の独立性の仮定を変更しませんか?また、私はまだ言及したアプローチから始めていませんが、これにより精度が向上しますか?精度は上がらないかもしれませんが、同じ精度を得るために必要なトレーニングデータの量は少なくなります。
machine-learning - ApacheMahoutの加重単純ベイズ分類器
カスタマーサポートの感情分析に単純ベイズ分類器を使用しています。しかし残念ながら、私はカスタマーサポートドメインに巨大な注釈付きデータセットを持っていません。しかし、同じドメインに少量の注釈付きデータがあります(約100個の正と100個の負)。アマゾンの商品レビューデータセットもあります。
とにかく、mahoutを使用して加重単純ベイズ分類器を実装して、カスタマーサポートデータの小さなセットとアマゾン製品レビューデータに小さな重みを与えることができますか?上記の重み付けされたデータセットのトレーニングにより、精度が大幅に向上すると思います。親切に同じことで私を助けてください。
r - 多項単純ベイズ分類器
私はCRANで多項単純ベイズ分類器を探していましたが、これまでのところ、パッケージ内の二項実装だけを思いつくことができますe1071
。多項ベイズ分類器を備えたパッケージを知っている人はいますか?
matlab - Matlabナイーブベイズ
こんにちは、KDD 1999データセットを使用しているImです。私は、matlabのナイーブベイをそれに適用しようとしていました。私が知りたいのは、単純ベイズのコードで以下の「トレーニング」と「target_class」に気付いた場合、kddデータセットは494021x42のデータ配列です。
私が知りたいのは、kddデータセットの攻撃タイプに関連する「Target_class」ですか?
または、ターゲットクラスは「テスト」セットに含まれる列ヘッダーですか?すなわち
weka - 属性選択+weka+ Naive Bayes
次の3つの方法のうち、属性選択を実行するのに最適な方法はどれかと思います。
- メタ分類子を使用する
- フィルターアプローチ
- 属性選択クラスを直接使用するネイティブアプローチ
私が使用している分類器はNaiveBayesです。
誰かが私に最良の選択を見つけるように案内してもらえますか?
python - 単純ベイズ分類器をNLTKに保存
訓練された分類器をどのように保存するかについて、少し混乱しています。のように、使用するたびに分類器を再トレーニングすることは明らかに非常に悪くて遅いですが、どうすればそれを保存し、必要なときに再度ロードすることができますか?コードは以下のとおりです。よろしくお願いします。NLTKナイーブベイズ分類器でPythonを使用しています。
algorithm - 単純ベイズ分類の簡単な説明
ナイーブベイズのプロセスを理解するのは難しいと感じています。誰かが英語で簡単なステップバイステップのプロセスでそれを説明できるかどうか疑問に思いました。確率として発生した時間ごとの比較が必要であることは理解していますが、トレーニングデータが実際のデータセットとどのように関連しているかはわかりません。
トレーニングセットが果たす役割について説明してください。ここでは、バナナなどの果物の非常に簡単な例を示します。
python - NLTKでのBag-of-WordsNaive-Bayes分類器の実装
私は基本的にこの男と同じ質問をします..ナイーブベイズ分類器のNLTKブックの例では、単語がドキュメント内で特徴として出現するかどうかのみを考慮します..単語の頻度を特徴として考慮しません("bag-of-words")を見てください。
答えの1つは、組み込みのNLTK分類器ではこれを実行できないことを示唆しているようです。そうですか?NLTKを使用して頻度/単語の袋のNB分類を行うにはどうすればよいですか?
algorithm - 単純ベイズ分類器の「単純」とは何ですか?
ナイーブベイズのナイーブとは何ですか?