Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
特定のドメインに一連のテキストファイルがあります。いくつかのメトリックに基づいてファイルをランク付けする必要があります。
テキストファイルのランク付けに使用できるいくつかのメトリック(用語の頻度、サイズ、使用頻度など)を手伝ってください。次に、テキストマイニング手法を使用して、これらの手法の1つに基づいてファイルをランク付けしたいと思います。
私が遭遇した主な問題は、関連性またはその他のメトリックに従ってドキュメントをランク付けすることです。
これで、コンテンツ(関連性)に基づいてランク付けされたドキュメントの方が良い結果が得られるという結論に達しました。
クエリで指定された検索ワードに基づいてドキュメントをランク付けするために、ベクトルベースのアプローチを利用しています。それが最善のアプローチかどうかはわかりませんが、平均的な精度で結果が得られます