0

特定のドメインに一連のテキストファイルがあります。いくつかのメトリックに基づいてファイルをランク付けする必要があります。

テキストファイルのランク付けに使用できるいくつかのメトリック(用語の頻度、サイズ、使用頻度など)を手伝ってください。次に、テキストマイニング手法を使用して、これらの手法の1つに基づいてファイルをランク付けしたいと思います。

4

1 に答える 1

0

私が遭遇した主な問題は、関連性またはその他のメトリックに従ってドキュメントをランク付けすることです。

これで、コンテンツ(関連性)に基づいてランク付けされたドキュメントの方が良い結果が得られるという結論に達しました。

クエリで指定された検索ワードに基づいてドキュメントをランク付けするために、ベクトルベースのアプローチを利用しています。それが最善のアプローチかどうかはわかりませんが、平均的な精度で結果が得られます

于 2011-12-23T03:30:55.937 に答える