スパムとテキスト分類のためのベイジアン フィルタリングの適切でクリーンなオブジェクト指向プログラミング (OOP) 実装があるかどうか疑問に思っていました。これは学習目的のためだけです。
6 に答える
Javaで書かれたオープンソースのデータマイニングソフトウェアであるWekaを絶対にお勧めします。
Wekaは、データマイニングタスク用の機械学習アルゴリズムのコレクションです。アルゴリズムは、データセットに直接適用することも、独自のJavaコードから呼び出すこともできます。Wekaには、データの前処理、分類、回帰、クラスタリング、相関ルール、および視覚化のためのツールが含まれています。また、新しい機械学習スキームの開発にも適しています。
上記のように、SVM、Winnow、C4.5、Naive Bayes(もちろん)などのさまざまな分類器が付属しています(APIドキュメントを参照)。スパム検出またはテキスト分類の分野では、多くの分類器がNaiveBayesよりもはるかに優れたパフォーマンスを発揮することが知られていることに注意してください。
さらに、Wekaは非常に強力なGUIを提供します…</ p>
Programming Collective Intelligenceの第 6 章をご覧ください。
多分https://ci-bayes.dev.java.net/またはhttp://www.cs.cmu.edu/~javabayes/Home/node2.html ?
私もそれで遊んだことはありません。
C# でのベイジアン フィルタリングの実装を次に示します。C#用のナイーブ ベイジアン スパム フィルタ(CodeProject でホスト)。
nBayes - CodePlex でホストされている別の C# 実装
フランス語ですが、ダウンロード リンクを見つけることができるはずです :) PHP Naive Bayesian Filter