n次元を考慮したサポートベクターマシンを設計しています。すべての次元に沿って、値の範囲は [0-1] です。さて、さまざまな理由により、特定のデータ ポイントについて、元のデータ セットから特定のディメンション全体の値を決定できない場合、そのディメンションに沿った値は SVM に対してどうあるべきでしょうか? 欠損値を示す [-1] として置けばよいのでしょうか?
ありがとうアビシェクS
n次元を考慮したサポートベクターマシンを設計しています。すべての次元に沿って、値の範囲は [0-1] です。さて、さまざまな理由により、特定のデータ ポイントについて、元のデータ セットから特定のディメンション全体の値を決定できない場合、そのディメンションに沿った値は SVM に対してどうあるべきでしょうか? 欠損値を示す [-1] として置けばよいのでしょうか?
ありがとうアビシェクS
ディメンションがマシンのスペースの分割に寄与できない場合は、欠落している値を完全に除外した方がよいでしょう。これは、SVM ができる唯一のことは、その次元のすべてのポイントが同じ場所にあるため、分類力の範囲でその次元にゼロの重みを置くことだからです。
したがって、その次元を通過するたびに計算リソースが浪費されます。この値を回復することが重要な場合は、ある種の回帰モデルを使用して推定値を取り戻そうとすることができますが、その推定値が他のデータから生成された場合でも、実際には貢献しません。 SVMは、その推定次元のデータは、それを生成するために使用したデータの要約にすぎないためです(SVMモデルにはすでにあると思います)。