9

私は PMML: Predictive Model Markup Language ( www.dmg.org ) の初心者であり、PMML ファイルの作成/解析のための何らかの Java サポート (オープン ソース/プロフェッショナル) があるかどうか疑問に思っていました。

最初は、Java 環境からプログラムで PMML ファイルを作成/解析する可能性だけを念頭に置いていました。

私は「グーグル」であり、いくつかの可能性を見つけました:

オープンソース:

ジャワ出身。

  • JDM。javax.datamining. それは死んでいるようですか?誰かがより多くの情報を持っていますか?

プロ。

自作

  • XML Java ライブラリを使用して、PMML ファイルのパーサー/ライターを自分で構築する

皆様のご意見をお待ちしております。

前もって感謝します

オスカー

4

1 に答える 1

1

答えは、使用したい MODEL-ELEMENT によって異なる可能性があることに注意してください。また、PMML を作成して PMML を解析するための最適なオプションは、さまざまなソフトウェア パッケージから得られる可能性が非常に高いです。「PMMLの作成」とは、モデルではなくドキュメントを意味すると仮定します。自動モデル フィッティングと実行を統合している人は聞いたことがありませんが、おそらく既に存在しています。確かに、SOAP を使用して PMML モデルを渡すことができます。

他のプロジェクトについて話すことはできませんが、 Adapaと呼ばれる Zementis が提供する製品は、PMMLの実行にのみ使用されます。本製品は、フィッティングしたモデルをPMMLにエクスポートして作成するモデルフィッティングアプリケーションがあることを前提としています。十分に開発されたモデル フィッティング アプリケーションがすでにたくさんあるので、これは妥当な仮定だと思います。

私が使用したバージョン (3.6) は一般的に高速でしたが、特に大きなヒープがなければ、典型的なランダム フォレスト サイズ (500 以上の木) のアンサンブルを処理できませんでした。新しいバージョンでこれを修正した可能性があると思います。宣伝されていませんが、Zementis はいくつかのモデル、つまりテキスト モデル、シーケンス、ベースライン モデル、時系列 (PMML 標準には現在のところ指数平滑法しかありません) を提供していないようです。私のバージョンにも K-Nearest Neighbors はありませんが、最近のバージョンにはあると聞いています。

統合されたフィッティングと実行を検討している場合を除き (この場合、オンライン学習を検討する必要があります)、次の質問を順番に検討することをお勧めします。

  1. 使用したいモデル タイプは何ですか?
  2. モデルを構築するのにどのアプリケーションが適していますか?
  3. 最後に、これをどのように実行し、この点に関してどのような要件がありますか (Web サービス、クラウド、パフォーマンスなど)。

DMG グループのメンバーのリストを見ると、供給側 (SAS、SPSS、トガワレ、Rapid-I など) または需要側 (非常に多くのリスト) にある多くの商用ベンダーが見つかります。

あなたのリストではWekaについても言及していませんでしたが、それらはいくつかのPMMLモデルも実行し、 R / Javaベースのソリューションがあるため、Java環境でPMML-> Rインポート(fileToXMLNodeを参照)を実行できます(ただし、単に実行することもできますR)。

最後に、非常に具体的なモデルを念頭に置いていて、「それを実行する」ことが数学的に何を意味するかを理解している場合は、必要なものを自分で構築することはそれほど難しくありません。

于 2014-05-31T20:35:40.557 に答える