22
  • 単純ベイジアン分類のオレンジフレームワークを試しました。

    • メソッドは非常に直感的ではなく、ドキュメントは非常に整理されていません。ここで誰かが推奨する別のフレームワークを持っていますか?
    • 今のところほとんど使ってNaiveBayesianいます。
  • nltk を使用することをNaiveClassification考えていましたが、連続変数を処理できるとは考えていません。

私のオプションは何ですか?

4

6 に答える 6

25

scikit-learn には、ガウス単純ベイジアン分類器が実装されています。一般に、このライブラリの目標は、読みやすく使いやすいコードと効率の間の適切なトレードオフを提供することです。うまくいけば、アルゴリズムの作業を学ぶための優れたライブラリになるはずです。

于 2010-09-11T14:38:10.193 に答える
13

ここから始めるのがよいでしょうこれは、単純なベイジアン分類器の Python 実装の完全なソース コード (テキスト パーサー、データ ストレージ、および分類器) です。完全ではありますが、1 回のセッションで消化するにはまだ小さいです。コードはかなりよく書かれており、コメントも充実していると思います。これは本Programming Collective Intelligenceのソース コード ファイルの一部です。

ソースを取得するには、リンクをクリックし、メイン フォルダー「PCI_Code」から zip を dl して解凍し、python ソース ファイル「docclass.py」があるフォルダー「chapter 6」に移動します。これは、ベイジアン スパム フィルターの完全なソース コードです。トレーニング データ (電子メール) は、同じフォルダー ('test.db') にも含まれる sqlite データベースに保持されます。必要な唯一の外部ライブラリは、sqlite (pysqlite) への python バインディングです。まだインストールしていない場合は、sqlite 自体も必要です)。

于 2010-04-11T23:05:50.617 に答える
9

自然言語を処理している場合は、 Natural Language Toolkitを確認してください。

他のものを探している場合は、PyPI で簡単に検索してください。

pebl連続変数を処理するようです。

于 2010-04-05T18:13:54.837 に答える
3

Divmod Reverendは、Pythonベイズ分類器を使用するのに最も簡単で簡単であることがわかりました。

于 2011-03-06T15:43:39.490 に答える
2

Paul GrahamのLISPのものを取り、Pythonに変換しました http://www.paulgraham.com/spam.html

于 2010-04-16T17:17:56.413 に答える
0

SpamBayesもあります。これは、スパムだけでなく、一般的な単純ベイズ分類器として使用できると思います。

于 2011-03-06T14:26:35.807 に答える