問題タブ [pmml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ctree で PMML ファイルを生成できません
R で「虹彩」データを使用して決定木分析を行っています。ここでの問題は、印刷とプロットを使用して出力を取得するという点ですべてが正常に機能することですが、 ctree を使用して PMML ファイルを生成しようとすると、次のエラーが発生します。
rpart ライブラリを使用すると、PMML を正常に生成できますが、ctree で pmml が生成されない理由がわかりません。私は機能する結果と機能しない結果の両方を入れています
Windows(64ビット)バージョン3.0.2でRを使用しています。
誰かがなぜそれが起こっているのか理解できたら、前もって感謝しますか?
python - Augustus (Python) を使用して、DefineFunction を含む PMML モデルを適用できますか?
私は PMML モデルのコンシューマとして Augustus を使用しています。次のように、2 つの数値を加算する例を変更して、DefineFunction 要素を含めました。
このモデルをファイルに保存し、次のように実行してみます。
ただし、エラーが発生します。
私は最新のトランク (リビジョン 794) を使用しており、変更されていないサンプル (DefineFunction なし) を問題なく実行できます。Augustus は DefineFunction をサポートしていますか?
python - 機械学習モデルの永続化オプション
トレーニング済みの機械学習モデルを永続化して再利用するための提案/ベスト プラクティスはありますか? Python または R でモデルを開発しています。次に、これらのモデルを生産ワークフローでスコアリングのために使用する必要があります (R が使用できない場合)。たとえば、R でトレーニングされたロジスティック回帰モデルがあるとします。このモデルに対して新しい観測値をスコアリングする必要があります。スコアリング エンジンは高速でスケーラブルでなければなりません。フォローしようと思った
PMML ( http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language )。R で開発されたほとんどのモデルを pmml に変換するのは簡単です。しかし、PMML モデルに役立つスコアリング エンジンは見つかりませんでした。たとえば、augustus ( https://code.google.com/p/augustus/ ) がありますが、まだ 3 ~ 4 つのモデルしか実装していません。
Python で pickle を使用してモデルをシリアル化し、Python でコンシューマーを記述します。
正しいアプローチに関する考えや提案はありますか?
r - R PMML クラス分布
pmml パッケージを使用して R 分類子を PMML にエクスポートしようとしているときに、ツリー内のノードのクラス分布がエクスポートされていないことに気付きました。
PMML は ScoreDistribution 要素でこれをサポートします: http://www.dmg.org/v1-1/treemodel.html
PMMLにこの情報を含める方法はありますか? この情報に依存する別のツールで PMML を読み取りたいと考えています。
私は次のようなことをしています:
r - R randomForest から PMML クラスへのインデックスが間違っています
R randomForest モデルを PMML にエクスポートしています。結果の PMML には、DataDictionary 要素の最初の要素として常にクラスが含まれますが、これは常に正しいとは限りません。
これを修正する方法、または少なくとも PMML をカスタム拡張要素でインクリメントする方法はありますか? そうすれば、そこにクラス インデックスを配置できます。
pmml パッケージのドキュメントと pmmlTransformations パッケージを調べましたが、この問題の解決に役立つ情報は見つかりませんでした。
r - R モデルを本番環境にデプロイするためのオプション
予測モデルを本番環境に展開するためのオプションはそれほど多くないように思われますが、これはビッグ データの急増を考えると驚くべきことです。
オープンソースの PMML を使用してモデルを XML 仕様としてエクスポートできることを理解しています。これは、データベース内のスコアリング/予測に使用できます。ただし、これを機能させるには、Zementis の PMML プラグインを使用する必要があるようです。これは、ソリューションが真のオープン ソースではないことを意味します。スコアリングのために PMML を SQL にマップする簡単なオープンな方法はありますか?
もう 1 つのオプションは、XML の代わりに JSON を使用してモデル予測を出力することです。しかし、この場合、R モデルはどこに位置するのでしょうか? Rモデルがデータと同じサーバーに置かれ、Rスクリプトを使用してその受信データに対して実行されない限り、常にSQLにマップする必要があると思いますか?
そこに他のオプションはありますか?
sas - SAS から予測モデル マークアップ言語へ
私は現在、SAS で開発されたモデルの実装に取り組んでいます。SAS コードを PMML に直接変換する方法はありますか?
python - Hadoop プラットフォームで使用するための Scikit Learn ランダム フォレストのエクスポート
私は pandas と scikit Learn を使用してスパム分類器を開発し、Hadoop ベースのシステムに統合する準備が整いました。この目的のために、分類器をピクルよりも一般的な形式にエクスポートする必要があります。
Predictive Model Markup Language (PMML) は、私が好むエクスポート形式です。これは、すでに使用しているカスケーディングと非常にうまく機能します。しかし、驚いたことに、scikit-learn モデルを PMML にエクスポートする Python ライブラリが見つかりません。
このユースケースを経験した人はいますか? scikit-learn と Hadoop の間の相互運用性を提供する PMML に代わるものはありますか? 堅実な PMML エクスポート ライブラリはどうですか?