-1

Octave を使用して機械学習手法を適用することを学んでいます。機械学習では、分類問題はその特徴に基づいてケースを分類しようとします。たとえば、機械学習アルゴリズムは 100 の要素を調べて、ある人がローンを滞納するかしないかを判断しようとするかもしれません。(つまり、その人がクラスに属している場合の出力がデフォルトになるか、クラスがデフォルトにならない)。

「エラー分析」 (つまり、誤分類された出力を手動で分析すること) は、機械学習の分類問題の間違いを特定するのに役立つことを学びました。

非分類問題の類推はありますか? 具体的には、機械学習アルゴリズムが値 (例: 個人の収入) を予測しようとしているが、それが間違っている場合、アルゴリズムが失敗する理由を理解しようとするエラー分析に類似したものはありますか?

4

2 に答える 2

1

絶対!予測ごとに予測がどれだけ外れているかを記録しておくと、通常は傾向を非常に明確に特定できますが、このアプローチは通常、データを視覚化する巧妙な方法に依存します。

たとえば、平均誤差が 100 であるが、入力変数の 1 つが (定性的に) 非常に高いか、または非常に低い例では、平均誤差が 1000 に跳ね上がることに気付いた場合、おそらくそれらの高低をより適切に説明するために調整する必要があります。値。

機械学習の多くは科学というより芸術に近いため、特定の問題に対してどの形式のエラー分析が意味を成すかを正確に言うのは困難ですが、一般的な解決策は、制約のあるサンプル セットの平均エラーの傾向を調べることです (つまり、外が 90 度を超えている場合のテニス スコア予測の平均誤差は?)

理論的には、状態間の違いが明らかであり、明らかな変化につながるようなテストを選択する必要があります。たとえば、1 つの変数を考慮していない場合、その変数の値に対してエラーをスキャンし、それを視覚的にプロットして、ノイズがあるように見えるかどうか、または含めるかどうかを決定する明確な傾向があるかどうかを判断することができます。その変数。

ご不明な点やご不明な点がございましたら、お気軽にお問い合わせください。

于 2013-05-30T20:36:00.077 に答える
0

回帰の結果を分析するための多くのツールがあります (収入に基づいて推定しようとする場合を説明します)。最も一般的なものは、平均二乗誤差と、ピアソンスピアマンなどの相関の尺度です

最後に、ここでは最も基本的な方法しか説明していないことを強調しておきます。優れた統計の教科書を参考にしてください。

于 2013-05-31T04:17:56.313 に答える