Azure Machine Learning は初めてです。トレーニング データに欠損値があるトレーニング実験を作成しました。不足しているデータとその他の変換を処理するためのロジックは、このデータで動作する Python コードにあります。
テストデータにも同じことが必要です。実験を Web サービスとしてデプロイしました。そのため、スキーマは入力データと出力データ (すべて数値フィールド) に対して生成されます。
2 つの質問: 1. テスト データのラベルも定義するように求められます。そうしないと、テスト データにラベル列が欠落しているため、列数の不一致エラーが発生します
2. テスト データに欠落データがいくつかあります。理想的には Python スクリプト実験では注意が必要です。しかし、スキーマが原因で次のエラーが発生します。
The request failed with status code: 400
Content-Length: 323
Content-Type: application/json; charset=utf-8
Server: Microsoft-HTTPAPI/2.0
Date: Thu, 21 Jan 2016 11:44:49 GMT
Connection: close
{u'error': {u'message': u'Invalid argument provided.', u'code': 'BadArgument', u'details': [{u'message': u'Parsing of input vector failed. Verify the input vector has the correct number of columns and data types. Additional details: Value was either too large or too small for an Int32..', u'code': u'InputParseError', u'target': u'input1'}]}}