1

立法文書の全文索引付けを行うために、SQL Server 2012 を使用しています。ただし、2012 年にはセクション記号 (§) などの文字を含むクエリを作成できないようです。

どの文字が「クエリ不可」であるかを示す MSDN のドキュメントが見つからないようです。私たちのユース ケースでは、セクション シンボル (§) がクエリから除外されるのはかなり厄介なようです (sys.dm_fts_parser を使用してクエリを解析するときに確認されたように)。

SQL Server 2012 と全文検索を使用して、何らかの構成または回避策を実装することで、これを行うことは可能でしょうか?

4

2 に答える 2

0

カスタム ワード ブレーカーの実装をまだ確認していません。LIKE 検索を使用すると、フルテキスト インデックスを使用する目的に反することになり、パフォーマンスが低下すると思います。ただし、特定の文字を実際に除外するようにワード ブレーカーを構成できることがわかりました。ここで説明します:

http://technet.microsoft.com/en-us/library/hh231252.aspx およびこちらhttp://technet.microsoft.com/library/cc263242.aspx

これは、SQL Server 2012 のフルテキスト インデックスで § などの記号をクエリ可能にするための答えになると思います。

残念ながら、これは一部の言語でのみ可能です。デンマーク語はサポートされている言語の 1 つであり、これを使用することになっています (インデックスに登録されているドキュメントの言語はデンマーク語です)。言語としてデンマーク語を使用する場合の分析は、おそらく SQL サーバー 2008/2012 でデンマーク語に使用される Stemming クラスに由来します。現在、デンマーク語に使用されるステミングの変更または無効化を検討しています。これは、可能であれば難しいことがわかりますが、StackOverflow に関するまったく別の質問に対するものです。

于 2013-09-13T13:59:21.167 に答える