2

多数の機能/属性(各アイテムあたり約5,800)を持つデータセットのマルチクラス分類にlibsvmを使用しています。現在使用しているデフォルトよりも、Cとガンマに適したパラメーターを選択したいと思います。

すでにeasy.pyを実行しようとしましたが、使用しているデータセットの場合、推定時間はほぼ永久になります(20、50、100、および200のデータサンプルでeasy.pyを実行し、予測される超線形回帰を取得しました何年もかかる私の必要なランタイム)。

デフォルトよりも優れたC値とガンマ値にすばやく到達する方法はありますか?違いがあれば、私はJavaライブラリを使用しています。

4

1 に答える 1

3

私が信じているように、グリッド検索なしでこれを達成することは可能easy.pyです。

Trevor Hastie他のこの論文を見てください:サポートベクターマシンの正則化パス全体(PDF)。1回の「SVM実行」で「C」のすべての値の損失が1回のショットで計算されるため、SVMのパフォーマンスにどのように影響するかを確認できます。

これらには、 svmpathパッケージを介してRで使用できるこのアルゴリズムの実装があります。

アルゴリズムのコアはFortranで書かれていると思いますが、Rでラップされています。

于 2010-05-06T17:20:26.940 に答える