ユーザーの入力文字列をサニタイズする必要があるのは、後で OLEDB クエリで文字列を使用してドキュメント リポジトリのインデックスを作成し、一致するファイルや説明などを見つけるためです。問題は、CONTAINS
ステートメントのクエリで特殊文字を含む文字列を使用できないことです。 .
精度を落とさずにサニタイズするために私がやっていることよりも良い方法はありますか?
私が現在行っていることは、検索文字列を取得し、正規表現を使用して検証し、[^0-9a-zA-Z\s\/\._-]+
空の文字列に置き換えて、検索文字列内のあらゆる種類の特殊文字を削除することです。
私の問題は、一部のファイルと説明に & や $ などの特殊文字が含まれていることです。特殊文字を許可しないと、検索精度が低下します。これを行うより効率的な方法はありますか?