0

自動類義語検索アルゴリズム (主にブランド名用) を作成したいと考えています。たとえば、ユーザーが「Coca cola」という単語を入力した場合、「Coke」という単語を返したいと思います。

これは、辞書を使用して簡単に行うことができます。しかし、そのために辞書ファイルが必要です。どうすれば自動的に作成できますか? (私は100万件以上のレコードを持つ小さなコーパスを持っています。類義語はこれから来ます)。

この問題に対するテキスト マイニング アルゴリズムはありますか? また、これにはいくつかのオンライン同義語サービスがありますが、これらにはブランド名が含まれていません:-(

ありがとう、クリシー

4

1 に答える 1

0

トライベースのアルゴリズムは、同義語または類似の単語を見つけることができます。キーを使用するのではなく、ツリー内に配置してキーを定義します。たとえば、A から B に移動し、B から C に移動します。トライには多くのデータ構造があります。最も単純なものは、隣接リストまたは三分探索木です。

于 2012-06-18T10:29:56.460 に答える