私は多数のドキュメントを扱っており、ドキュメントのテキストに正確または不正確な形式で存在する一連の事前定義されたカテゴリ/タグ(フレーズの場合もあります)があります。各ドキュメントを、そのテキストに最も近いタグの1つだけに割り当てたいと思います。
この問題に対処するために何をすべきかについて、いくつかの指示を教えてください。
私は多数のドキュメントを扱っており、ドキュメントのテキストに正確または不正確な形式で存在する一連の事前定義されたカテゴリ/タグ(フレーズの場合もあります)があります。各ドキュメントを、そのテキストに最も近いタグの1つだけに割り当てたいと思います。
この問題に対処するために何をすべきかについて、いくつかの指示を教えてください。