0

現在、matlab で libsvm を使用して 2 つのラベルの分類を実行しています。特徴を抽出したところ、約 69 個あります。約 69 の機能を持つ 2 クラス分類に線形カーネルを使用しても問題ないかどうかを知りたいだけです。

ありがとう

マーカス

4

3 に答える 3

1

それは常にデータの性質に依存します。線形分離可能であれば、線形カーネルで十分です。

データが非線形で局所的にカプセル化されている場合 (つまり、新しいポイントを含むすべてのデータを囲む超球体が存在する場合)、RBF カーネルはジョブに適したカーネルのように聞こえます。

データが非線形であるがカプセル化されていない場合 (そのため、常にトレーニング セット データから離れた新しいポイントである可能性があります)、多項式などの連続カーネルを試してみることをお勧めします)。

高次元空間でデータの性質を推測するのは難しいため、ほとんどの場合、実用的な解決策はさまざまなシナリオを試し、交差検証を使用して適切なカーネルとパラメーターを選択することです。

ただし、さまざまな特徴のペアをプロットすると、データの性質について理解するのに役立つ場合がありますが、これは非常に大まかな指標にすぎません。

于 2013-01-21T13:25:58.010 に答える
1

それは本当に状況に依存します。シナリオが異なれば、結果はカーネルごとに異なります。試す必要があります。

RBF カーネル、多項式カーネルを試してみてください。カーネルが異なれば結果も異なります。あなたは試してみる必要があります。

于 2013-01-21T04:49:14.903 に答える
1

はい、全然大丈夫です。約 5000 の特徴を持つデータに線形カーネルを使用しました。(これが最善の方法だとは言いませんが、可能です。)

さらに良いことに、RBF カーネルも試して結果を比較してみませんか?

于 2013-01-21T04:44:18.537 に答える