自動類義語検索アルゴリズム (主にブランド名用) を作成したいと考えています。たとえば、ユーザーが「Coca cola」という単語を入力した場合、「Coke」という単語を返したいと思います。
これは、辞書を使用して簡単に行うことができます。しかし、そのために辞書ファイルが必要です。どうすれば自動的に作成できますか? (私は100万件以上のレコードを持つ小さなコーパスを持っています。類義語はこれから来ます)。
この問題に対するテキスト マイニング アルゴリズムはありますか? また、これにはいくつかのオンライン同義語サービスがありますが、これらにはブランド名が含まれていません:-(
ありがとう、クリシー