-1

私は多数のドキュメントを扱っており、ドキュメントのテキストに正確または不正確な形式で存在する一連の事前定義されたカテゴリ/タグ(フレーズの場合もあります)があります。各ドキュメントを、そのテキストに最も近いタグの1つだけに割り当てたいと思います。

この問題に対処するために何をすべきかについて、いくつかの指示を教えてください。

4

1 に答える 1

-1

インデックス作成中にドキュメントにタグを付ける lucene 検索エンジンを見ることができます。ノーザンライト検索エンジンは、検索方法であなたが言及した同様のタスクを実行していました。アイデアを得るために、その実装を見ることができます。

于 2013-03-01T12:23:32.187 に答える