現在、matlab で libsvm を使用して 2 つのラベルの分類を実行しています。特徴を抽出したところ、約 69 個あります。約 69 の機能を持つ 2 クラス分類に線形カーネルを使用しても問題ないかどうかを知りたいだけです。
ありがとう
マーカス
現在、matlab で libsvm を使用して 2 つのラベルの分類を実行しています。特徴を抽出したところ、約 69 個あります。約 69 の機能を持つ 2 クラス分類に線形カーネルを使用しても問題ないかどうかを知りたいだけです。
ありがとう
マーカス
それは常にデータの性質に依存します。線形分離可能であれば、線形カーネルで十分です。
データが非線形で局所的にカプセル化されている場合 (つまり、新しいポイントを含むすべてのデータを囲む超球体が存在する場合)、RBF カーネルはジョブに適したカーネルのように聞こえます。
データが非線形であるがカプセル化されていない場合 (そのため、常にトレーニング セット データから離れた新しいポイントである可能性があります)、多項式などの連続カーネルを試してみることをお勧めします)。
高次元空間でデータの性質を推測するのは難しいため、ほとんどの場合、実用的な解決策はさまざまなシナリオを試し、交差検証を使用して適切なカーネルとパラメーターを選択することです。
ただし、さまざまな特徴のペアをプロットすると、データの性質について理解するのに役立つ場合がありますが、これは非常に大まかな指標にすぎません。
それは本当に状況に依存します。シナリオが異なれば、結果はカーネルごとに異なります。試す必要があります。
RBF カーネル、多項式カーネルを試してみてください。カーネルが異なれば結果も異なります。あなたは試してみる必要があります。
はい、全然大丈夫です。約 5000 の特徴を持つデータに線形カーネルを使用しました。(これが最善の方法だとは言いませんが、可能です。)
さらに良いことに、RBF カーネルも試して結果を比較してみませんか?