2

google-api-ruby-client の挿入機能を使用して、trainingInstances の配列を渡しています。

predict を呼び出すと、以前は 0.653264 や 0.346736 などのスコアを取得していました (2 つの出力カテゴリを使用)。

リファクタリングを行った後、スコアは常に 1.0 と 0.0 になり、その間に確率はありません。

予測精度 (私が測定) は、ステータス関数によって与えられる精度にまだ近いため、トレーニング済みのモデルが機能しているように見えます。アプリケーションでスコアを使用したいので、1 から 0 の間のスコアが得られない理由を知りたいだけです。

どんな洞察も大歓迎です。

以下は、私が使用しているトレーニング データのサンプルです。

"Completed Registration",32.54,2,0,1,12
"Completed Registration",27.05,2,0,1,7
"Completed Registration",27.29,1,0,3,7
"Completed Registration",24.15,1,0,1,6
"Completed Registration",26.36,2,0,1,6
"Completed Registration",27.0,3,1,3,5
"Completed Registration",22.15,3,1,3,5
"Completed Registration",27.9,2,1,1,1
"Completed Registration",21.21,2,0,3,0
"Completed Registration",24.36,3,0,3,0
"Completed Registration",53.52,2,1,3,0
"Completed Registration",24.15,8,0,3,-6
"Cancelled Registration",,2,0,3,76
"Cancelled Registration",,2,0,3,76
"Cancelled Registration",,3,1,3,69
"Cancelled Registration",38.27,5,0,1,63
"Cancelled Registration",37.25,2,0,3,50
"Cancelled Registration",35.59,5,1,3,49
"Cancelled Registration",19.52,2,0,3,30
"Cancelled Registration",26.7,2,0,3,28

Google API Explorer でテストを実行し、トレーニング データを CSV ファイルにアップロードしました。

最初に (数週間前に) アップロードしたデータは、さまざまなスコアをもたらします。しかし、今日アップロードされたまったく同じデータのスコアは 1 または 0 しかありません。

これは文字エンコードの問題でしょうか?

4

1 に答える 1

0

他の人が同じ質問をしている場合に備えて、ここに回答を投稿しています。トレーニング データに応じて、API が内部的に異なる分類子を使用できることがわかりました。この違いは、私のリファクタリングではなく、API の変更によって生じたようです。

これは、Google https://groups.google.com/forum/#!topic/prediction-api-discuss/7QPhONKhZjcの誰かからの説明です。

于 2015-12-31T07:55:05.247 に答える