Postgres とそのフルテキスト機能を使用して、システム内のドキュメント (投稿コンテンツ) を検索していますが、非常にうまく機能しています。
オートコンプリートのために、ドキュメントで使用されているすべての単語を含むインデックス (辞書?) を作成し、最も頻繁に使用される単語で検索したいと考えています。私たちは常に1つの単語を検索します。フレーズを検索することはありません。
だから私が書くと:
- 「目」
私は受け取ります(私たちの文書で最も頻繁に使用される単語を想定してください):
- "これ"
- "そこの"
- 「想い」
- ...
Postgresでそれを行う方法は? それとも、apache lucene / solr のようなより高度なソリューションが必要でしょうか?
postgres 全文検索 (字句を提供する) も postgres trigram も、この作業には適していないようです。それとも私が間違っているのでしょうか?
テキストを手動で解析したり、エラーが発生しやすいすべての英語のストップワードを無視したりしたくありません。Postgres は、lexem インデックスを構築する際にこれをうまく処理します。しかし、語彙の代わりに、正規化せずに単語辞書を作成して検索する必要があります
ご協力いただきありがとうございます