私は多くのサポート ベクター マシンの本や技術論文を読みましたが、ほとんどのテキスト分類タスクで線形カーネルを選択する際に多くの著者が想定していることです。
彼らは、テキスト分類問題のデータはすでに高次元空間に存在するため、SVM を使用してデータを分類しようとしている間、データを分離するために線形カーネルを選択するだけで十分であると言っています。
この仮定に対する私の理解は次のとおりです。
どのテキスト分類タスクでも、分類タスクで選択される特徴 (多くの場合、ドキュメント内で探している特定の重要な単語) の数は非常に多くなります。高次元空間。
仮定の私の理解は正確ですか?そうでない場合は、誰かがこの仮定に光を当てるようにしてほしい.
どんな助けでも大歓迎です。