6

Postgres とそのフルテキスト機能を使用して、システム内のドキュメント (投稿コンテンツ) を検索していますが、非常にうまく機能しています。

オートコンプリートのために、ドキュメントで使用されているすべての単語を含むインデックス (辞書?) を作成し、最も頻繁に使用される単語で検索したいと考えています。私たちは常に1つの単語を検索します。フレーズを検索することはありません。

だから私が書くと:

  • 「目」

私は受け取ります(私たちの文書で最も頻繁に使用される単語を想定してください):

  • "これ"
  • "そこの"
  • 「想い」
  • ...

Postgresでそれを行う方法は? それとも、apache lucene / solr のようなより高度なソリューションが必要でしょうか?

postgres 全文検索 (字句を提供する) も postgres trigram も、この作業には適していないようです。それとも私が間違っているのでしょうか?

テキストを手動で解析したり、エラーが発生しやすいすべての英語のストップワードを無視したりしたくありません。Postgres は、lexem インデックスを構築する際にこれをうまく処理します。しかし、語彙の代わりに、正規化せずに単語辞書を作成して検索する必要があります

ご協力いただきありがとうございます

4

0 に答える 0