0

私はデータ マイニング技術には精通していますが、テキスト マイニングや Web マイニングにはあまり詳しくありません。

これは単純な作業です: 記事を一連のカテゴリに分類します。記事のテキスト コンテンツを抽出して処理したとします。

カテゴリ (定義済みのラベル) を取得する方法と場所は? そのためのオントロジー、分類法をプラグインして、必要に応じて細かくすることは可能ですか? 分類タスクはマルチラベル分類になります。

この場合、近似マッチングに n-gram を使用しますか?

現在、テキストから抽出されたテーマと名前付きエンティティがあります。そのために Vowpal Wabbit を使用できますか?

4

1 に答える 1