radio/tested
次のようなクエリでヒットを返したいなどのシーケンスを含むドキュメントがいくつかあります。
select * from doc
where to_tsvector('english',body) @@ to_tsvector('english','radio')
残念ながら、デフォルトのパーサーは(Windows環境にあるにもかかわらず)トークンradio/tested
としてfile
受け取るため、上記のクエリとは一致しません。それを実行ts_debug
すると、ファイルとして認識されていることがわかり、語彙素がradio/tested
2つの語彙素とではなく語彙素になっradio
てしまいtest
ます。
file
トークンを検索しないようにパーサーを構成する方法はありますか?私は試した
ALTER TEXT SEARCH CONFIGURATION public.english
DROP MAPPING FOR file;
...しかし、の出力は変更されませんでしたts_debug
。無効にする方法がある場合file
、または少なくともfile
途中でディレクトリ名を構成すると思われるすべての単語を認識させる方法がある場合、またはスラッシュをハイフンまたはスペースとして処理する方法がある場合(パフォーマンスに影響を与えることなく)自分でそれらをregexp_replace
することの)それは本当に役に立ちます。