8

一部の列のデータをテーブルに格納するフルテキスト カタログを作成しましたが、単語の区切り記号と見なしたくない文字によってコンテンツが分割されているようです。(「/」、「-」、「_」など)

ワード ブレーカーの言語を設定できることはわかっています。http ://msdn.microsoft.com/en-us/library/ms345188.aspxで、新しい言語をインストールする方法についていくつかのアイデアが得られますが、それよりも直接的な制御が必要です。 、これらの言語はすべて、私が壊れたくない文字で壊れているためです。

ワード ブレーカーを見つけるために使用する独自の言語を定義する方法はありますか?

4

2 に答える 2

5

フルテキスト インデックスでは、インデックス作成中に文字_`のみが考慮されます。他のすべての文字は無視され、単語はこれらの文字が出現する場所で分割されます。これは主に、フルテキスト インデックスが大きなドキュメントのインデックスを作成するように設計されており、適切な単語のみを考慮してより洗練された検索を行うためです。

同様の問題に直面しました。これを解決するために、@、-、/などの文字が ' `at` '、' `dash` '、' `slash` ' などの特殊なシーケンスに置き換えられた変換テーブルが実際にありました。全文を検索している間、検索文字列内の文字をこれらの特別なシーケンスに置き換えて検索する必要があります。これにより、特殊文字が処理されます。

于 2012-10-29T06:22:12.367 に答える
3

FTS インデックス作成を構成する機能は、そのままではかなり制限されています。これを行うために言語を使用できるとは思いません。

挑戦するつもりで、C++ の知識にアクセスできる場合は、いつでもカスタム IFilter 実装を作成できます。些細なことではありませんが、それほど難しくはありません。IFilter リソースについては、こちらを参照してください

于 2010-10-22T18:55:44.750 に答える