machine-learning - 分類で最も弱い特徴を特定する

Question

機械学習の基本的な演習は、一部のデータに対して回帰を実行することです。たとえば、魚の長さを体重と年齢の関数として推定します。

これは、多くの場合、大規模なトレーニングデータセット (体重、年齢、長さ) を用意し、回帰分析を適用することによって行われます。その後、体重と年齢から新しい魚の長さを推定することができます。

ただし、代わりにこの問題を解決したいと仮定します。

これはよくある問題のようですが、私はそれが何と呼ばれているのかわかりません。誰かが私を正しい方向に助けてくれますか。問題が線形である場合、問題にどのように取り組みますか? また、非線形である場合はさらにどうしますか?

score 0 · Accepted Answer

あなたは機能的な依存関係を探しています

f: IR -> IR^2,  f(Weight) = (Age, Length)^T

基本的には、現在使用しているのと同じ方法でこれを行うことができます。ターゲットが 2 次元であるため、損失関数を調整する必要があるだけです。

予測変数の大きさと単位が異なるため、2 次元空間での単純なユークリッド距離はここでは役に立ちません。したがって、ここでは創造性を発揮する必要があります。たとえば、両方の予測子を [0,1] に正規化し、正規化された値をユークリッドまたは L1 距離損失関数に入力できます。

適切な損失関数を取得したら、通常どおりに進みます。機械学習方法を選択し、データを適合させ、予測を行います。

メソッドの選択に関して: これは、単純で相関のないもの (たとえば、2 つの無関係な線形回帰、またはより一般的な 2 つの 1 次元出力メソッドのスタック) から、相関のあるより洗練されたものまでさまざまです。 ANN パラメータが関連付けられている 2 つの出力ノード。

最後に、線形回帰の場合の例を次に示します。そこであなたはアンザッツを作ります

(Age, Length)^T =  (a1 + b1* Weight, a2 + b2*Weight)^T

最も単純なケースでは、a1, b1, a2, b2損失関数を最小化してパラメーターを見つけます。L

L(a1,b1,a2,b2) = || Age - a1 + b1 * Weight ||^2 + || Length - a2 + b2 * Weight ||^2

この選択は、2 つの分離された 1 次元線形回帰になります。罰金。

ただし、多くの場合、ターゲットパラメータ間の一貫性も求められます。直観的には(Age, Length)、1 つの大きな偏差と 1 つのゼロ偏差よりも、2 つの小さな偏差を好むことになります。これは、相関メソッドと損失関数が入る場所です。

1 に答える 1