データが非線形に分離できる場合に、トレーニング エラー (0/1 損失) を最小限に抑える線形分類器を見つけようとしています。具体的には、重みを決定する方法を探しています。
sign(weights' * features) = label
features
\in {0, 1}^d、\ label
in {-1, 1} および実数値の重みの場合。N 個のトレーニング インスタンスがあり、可能な最大数のインスタンスに対して上記の式が成り立つようにしたいと考えています。問題が常に分離可能であれば、ハード マージン SVM のようなものが機能することはわかっていますが、そうでない場合にも解決策を見つける必要があります。
(このタスクは少し難解に聞こえるかもしれませんが、最小トレーニング誤差の線形分類器を探す代わりに何をすべきかについて私にアドバイスしないでください - 私が説明したことは間違いなく私が解決したい問題です!)