1

複合語の solr スペル チェッカーを実装したいと考えています。例えば

「アップル バナナ マンゴー」、「アップル マンゴー バナナ」、「マンゴー アップル バナナ」、「マンゴー バナナ アップル」、「バナナ アップル マンゴー」、「バナナ マンゴー アップル」を検討してください。

はすべて有効な複合語です。今、私は誰かが「アップル マンゴー バナナ」のスペルを間違えたときに、solr スペル チェッカーがスペルを「アップル マンゴー バナナ」として提案できるようにしたいと考えています。

私はこれを (機能的には正しい) 実装しましたが、そのような組み合わせごとにスペルチェック インデックスを作成しました。そのため、スペル チェックのインデックスが巨大になりました。このようなインデックスを作成すると、スペル チェック インデックスのサイズが 1GB 程度になると推定されました。

ここで、「apple mango banana」という複合語の組み合わせを 1 つだけ索引付けしたいと思います。

そして、solr がすべての組み合わせに対して正しいスペルを返すことを期待します。

考えられるすべての組み合わせにインデックスを付けなくても可能ですか?

4

1 に答える 1