ontology - ドキュメントのマルチラベル分類 - ラベルはどこで入手できますか? オントロジー？

翻译自：https://stackoverflow.com/questions/23712806 2014-05-17T15:03:37.197

197 次

私はデータマイニング技術には精通していますが、テキストマイニングや Web マイニングにはあまり詳しくありません。

これは単純な作業です: 記事を一連のカテゴリに分類します。記事のテキストコンテンツを抽出して処理したとします。

カテゴリ (定義済みのラベル) を取得する方法と場所は? そのためのオントロジー、分類法をプラグインして、必要に応じて細かくすることは可能ですか? 分類タスクはマルチラベル分類になります。

この場合、近似マッチングに n-gram を使用しますか?

現在、テキストから抽出されたテーマと名前付きエンティティがあります。そのために Vowpal Wabbit を使用できますか?

1 に答える 1