テキスト分類を使用してタイムライン検出の問題を解決しようとしています。初心者として、どうすればいいのか分からず困っています。これは分類の問題ですか?つまり、結果として年数 (タイムライン) を使用して、これを分類問題として解決できますか?
1 に答える
0
あなたが提案するように、これを分類問題として解決できるはずです。オプションとして、設定された期間でタグ付けされたテキストで構成されるコーパスを検索または構築し、このデータ セットで分類アルゴリズムをトレーニングすることが考えられます。
もう 1 つのオプションは、そのようなデータ セットで単語空間モデルをトレーニングし、さまざまな期間 (たとえば、50 年代、60 年代など) のベクトルを生成することです。次に、分類したいテキストの文書ベクトルを作成し、これらの時間ベクトルのどれが最も一致するかを見つけることができます。
うまくいかないかもしれませんが、どのような結果が得られるかを見るのは興味深いかもしれません。
お役に立てれば!
于 2012-10-31T12:39:03.780 に答える