問題タブ [pmml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - PMML 構文や論理エラーを見つけるのに役立つ PMML デバッガーはありますか?
ここ数週間、不適切な構文または論理エラーのある PMML ファイルの処理に多くの時間を費やしてきました。私の現在のプロセスでは、PMML ファイルを調べて、何が問題なのかがわかるまで JPMML コードをステップ実行しています。
私が見つけた一般的な問題、
- PMML の変数がどこにも定義されていません
- DerivedField If-Else ステートメントは欠落変数にフォールスルーし、missingValueReplacement を使用しません
- 文字列値の乗算を試みました
- DataDictionary で列挙されていないカテゴリ変数の MiningSchema で定義された invalidValueTreatment は、invalidValueTreatment が使用されないことを意味します。
PMML で使用できるデバッグ ツールは何ですか?
構文またはロジックのデバッグに役立つツールがあれば役立ちます。
java - sklearn2pmml と jpmml-sklearn の使用エラー
最近、scikit-learn モデルを PMML に変換する方法を探していたときに、sklearn2pmmlとjpmml-sklearnに出会いました。しかし、基本的な使用例を使用しようとするとエラーが発生し、理解できません。
sklearn2pmmlで例を使用しようとすると、 long を int としてキャストする際に次の問題が発生します。
ここで何が起こっているかについての提案はありますか?
使用コード:
EDIT 12/6: 新しいアップデートの後、同じ問題がさらに先に発生します:
spline - PMMLでスプライン関数を定義する最良の方法は何ですか?
PMML でスプライン関数 (つまり、defineFuction) を定義した人はいますか?
定義する必要があるパラメーターはかなり多く、かなり長い計算になります。たとえば、3 ノットの制限付き 3 次スプラインを持つ予測子の場合、7 つのパラメーター (2 つの係数、3 つのノット、1 つの基準点、1 つの予測子名を含む) があります。数学には、指数、最大ステートメントなどが少し含まれています。
これは、3 ノット RCS から値を計算する Javascript コードの例です。
pmml - PMML からの TransformedValue 出力 - 実装固有の違い
出力フィールドとして公開したい PMML モデルにいくつかの派生フィールドがあります。そして....AugustusとJPMMLの両方で(OpenScoringを介して)動作させることができますが、少し異なる方法で行う必要があるようです。どちらが正しく行っているかについて誰かが意見を持っているのだろうか?PMML 仕様は、これについて 100% 明確ではないようです。
JPMML の場合、必要な派生フィールドを参照するだけでそれを行うことができますが、MiningSchema に「予測」として含めることは避けなければなりません。
しかし、それはアウグストゥスには通用しません。そのためには、これらの出力を MiningSchema で「予測」フィールドとして宣言する必要があります。
そのため、ターゲット スコアリング環境に期待する内容に応じて、異なる PMML を生成する必要があります。しかし、どちらがそれを正しく行っていますか? または、移植性が高くなる別の表現方法はありますか?
上記のすべてのフラグメントで、foo_builtはfoo_input入力値に基づく単なる派生フィールドです。それがローカル変換であろうとグローバル変換であろうと、違いはないようです。
r - caret::train によって生成された glm 型モデルの pmml 表現を取得する
でトレーニングされた回帰モデルから PMML を生成しようとしcaret
ていmethod='glm'
ます。モデル例:
この関連する質問に対する受け入れられない回答type='rf'
は、マトリックス インターフェイスを使用することができないことを示唆しています。
したがって、マトリックスまたは式の構文を使用して pmml を取得することはできません (finalModel
いずれにせよ、まったく同じ s が生成されると確信しています)。
数式インターフェイスを使用してベース glm で動作します。
相互運用性のため、引き続き使用したいと思いますcaret
。some_glm
生産されたものを受け入れられるcaret
形式に変換する方法はありますか? pmml()
または、glm()
pmml 機能が必要な場合は、構造を使用する必要がありますか?
performance-testing - PMML アプリケーションのパフォーマンス テスト
JPMML エバリュエーターおよび/または独自の PMML スコアリング エンジンに基づく PMML アプリケーションのパフォーマンス テストを実施するためのベスト プラクティスを教えてください。http://dmg.org/pmml/pmml_examples/index.htmlで、いくつかのサンプル PMML と対応するテスト データを見つけました。しかし、私は非常に大きなデータ (実際の顧客トランザクション データセットを表す) を探しています。また、JPMML 1.2.6 は 1.2 よりも約 10 倍高速ですが、余分なメモリを消費することがわかりました。大規模なデータ セット (GB のデータセット) で検証するためのベスト プラクティスは何ですか?