私たちのシステムで受信テキストの自動タグ付けを行いたいのですが、全文索引が、索引付けされた行を指定してランク付けされた単語のリストを提供できるかどうか疑問に思っていました。
そうでない場合、これを行う方法について何か提案はありますか? 私たちはすでに自動タグ付けのシステムを用意していますが、その方法はかなり力ずくで(別名、遅い)、常に適切な単語リストを生成するとは限りません。
私たちのシステムで受信テキストの自動タグ付けを行いたいのですが、全文索引が、索引付けされた行を指定してランク付けされた単語のリストを提供できるかどうか疑問に思っていました。
そうでない場合、これを行う方法について何か提案はありますか? 私たちはすでに自動タグ付けのシステムを用意していますが、その方法はかなり力ずくで(別名、遅い)、常に適切な単語リストを生成するとは限りません。
そう思います。ここから
使用するために与えられたシナリオは次のsys.dm_fts_index_keywords_by_document
とおりです。
「全文索引に含まれるキーワードの数を知りたい」</p>
「キーワードが特定のドキュメント/行の一部であるかどうかを知りたい」</p>
「キーワードが全文索引全体で何回出現するか知りたい」 (sum(occurrence_Count) where keyword=……)
「特定のドキュメント/行にキーワードが何回出現するか知りたい」</p>
「特定のドキュメント/行に含まれるキーワードの数を知りたい」</p>
「特定のドキュメント/行に属するすべてのキーワードを取得したい」</p>