SSAS で単純なロジスティック回帰モデルをトレーニングしました。性別と NIC を個別の入力ノードとして使用し (NIC は非喫煙者の場合は 0、喫煙者の場合は 1)、スコア (0-100) を連続出力ノードとして使用します。
新しい参加者の性別と NIC の値に基づいてスコアを予測したいと考えています。もちろん、DMX でシングルトン クエリを実行できます。たとえば、次は 49.51... の値を生成します。
SELECT Predict(Score)
FROM [MyModel]
NATURAL PREDICTION JOIN
(SELECT 'M' AS Gender, '1' AS NIC) as t
しかし、DMX を使用する代わりに、SSAS から「切断」されている間にスコアを計算するために、モデルから 式を作成したいと考えています。
モデルを調査すると、出力ノードの NODE_DISTRIBUTION に次の情報があります。
ATTRIBUTE_NAME ATTRIBUTE_VALUE SUPPORT PROBABILITY VARIANCE VALUETYPE
Gender:F 0.459923854 0 0 0 7 (Coefficient)
Gender:M 0.273306289 0 0 0 7 (Coefficient)
Nic:0 -0.282281195 0 0 0 7 (Coefficient)
Nic:1 -0.802106901 0 0 0 7 (Coefficient)
0.013983007 0 0 0.647513829 7 (Coefficient)
Score 75.03691517 0 0 0 3 (Continuous
これらの係数をロジスティック回帰式に当てはめます -- 私は新しいユーザーとしてアップロードすることを許可されていません :) -- 上記の喫煙男性の例では、
f(...) = 1 / (1 + exp(0 - (0.0139830071136734 -- Constant(?)
+ 0 * 0.459923853918008 -- Gender:F = 0
+ 1 * 0.273306289390897 -- Gender:M = 1
+ 1 * -0.802106900621717 -- Nic:1 = 1
+ 0 * -0.282281195489355))) -- Nic:0 = 0
結果は 0.374 の値になります....しかし、この値を 0 ~ 100 のスコア分布に戻すにはどうすればよいでしょうか? つまり、上記の式を拡張して、DMX シングルトン クエリと同じ値を生成するにはどうすればよいでしょうか? Score ディストリビューションの stdev と mean が必要になると思いますが、これらの値を正確に使用する方法にこだわっています。また、5 行目の ATTRIBUTE_VALUE を定数として正しく使用しているかどうかもわかりません。
あなたが提供できるどんな助けも大歓迎です!