因子の可変長シーケンスの分類に適したカーネルを定義するための最良のアプローチはどれですか。Rでkernlabを使用しています。
ありがとう!
因子の可変長シーケンスの分類に適したカーネルを定義するための最良のアプローチはどれですか。Rでkernlabを使用しています。
ありがとう!
一般的に良い方法はありません。可変長係数は、次元間の関係がないことを意味するため、適切なカーネル関数は完全にデータ (問題) に依存します。
ただし、要因が大きなセットの要素にすぎないと仮定すると、最も基本的なアプローチは、Jaccard ベースのカーネルを使用することです。
K(A,B) = |A n B|
これは単に交差点のサイズを測定します。有効なカーネルであることを証明するのは簡単です。セット A をビットベクトルとしてエンコードするカーネル射影 phi(A) について考えることができます。ユニバース (A がサンプリングされる) は A に含まれます。K は、そのような要素の通常のスカラー積を定義します。
以下について読む必要があります。
Dynamic Time Warping (DTW) にインスパイアされたカーネル (グローバル アライメント カーネルなどの PDS 制約付き)。
通常、ADN 構造解析に使用される文字列カーネル(スペクトル カーネル、ミスマッチ カーネルなどを参照)。