2

次の Java ベイジアン推論フレームワークについてアドバイスしてください。

1. Is open-source
2. Can be used programmatically from Java app.
3. Will be able to process 10 GB data-set running on a single host (node) 
4. NOT Mahout or any other Hadoop-based / distributed frameworks (see 3.)
4

2 に答える 2

3

データのサイズは制限要因にはなりません。更新するモデルの複雑さです。単純なナイーブ ベイズ モデルであれば、実装は非常に簡単です。マルチ接続ネットワークなどのより洗練されたものが必要な場合は、モデルの複雑さによって、正確な推論を実行できるかどうか、または近似アルゴリズムなどのトレードオフが必要になるかどうかが決まります。

Kevin Murphy は最近、ベイジアン推論のソフトウェア比較をhttp://www.cs.ubc.ca/~murphyk/Software/bnsoft.htmlで更新しました。私が調査しているオープン ソース パッケージの 1 つは libDAI ( http://cs.ru.nl/~jorism/libDAI/ ) で、これは C++ ですが、Java から呼び出すことができると想定しています。これは、非常に優れた近似アルゴリズムであると思われるルーピー ビリーフ プロパゲーションを含む、複数の推論方法をサポートしています。

于 2013-04-07T14:13:49.537 に答える
1

多分wekaはあなたの法案に合っていますか?http://www.cs.waikato.ac.nz/ml/weka/ 要件 1、2、および 4 を確実に満たします。3 は、weka.core.Instances のカスタム実装のようなもので実行できるはずです。データのある種の「ストリーミング」を提供するため、すべてを一度にメモリに常駐させる必要はありません-しばらく使用していないため、よくわかりません。

于 2013-04-02T10:47:04.657 に答える