ねえ、これが私の問題です、
ドキュメントのセットが与えられた場合、各ドキュメントを事前定義されたカテゴリに割り当てる必要があります。
n-gramアプローチを使用して各ドキュメントのテキストコンテンツを表現し、次に、所有しているトレーニングデータでSVM分類器をトレーニングしました。
何か理解できなかった場合は訂正してください。
ここでの問題は、カテゴリが動的である必要があるということです。つまり、私の分類器は、新しいカテゴリの新しいトレーニングデータを処理する必要があります。
したがって、たとえば、特定のドキュメントをカテゴリA、カテゴリB、またはカテゴリCとして分類するように分類器をトレーニングした後、カテゴリDの新しいトレーニングデータが与えられた場合、分類器に「カテゴリD」の新しいトレーニングデータ。
要約すると、古いトレーニングデータ(3つのカテゴリ)と新しいトレーニングデータ(新しい/見えないカテゴリ)を組み合わせて、分類器を再度トレーニングしたくありません。分類器をその場でトレーニングしたい
これをSVMで実装することは可能ですか?そうでない場合は、いくつかの分類アルゴリズムをお勧めしますか?または私を助けることができる本/紙。
前もって感謝します。