2

テキストは、markdown、bbcode、htmlなどのいずれかを使用してデータベースに保存できます。検索語から許可されたタグを削除する必要がありますか?マークアップパーサーには、そのタスクを支援する方法がありますか?

'%searchword%'クエリのように使用するつもりでした。全文検索は、このような単純なテキスト検索に何か利点がありますか?

更新:これを行う方法は本当にたくさんあるようです。私の状況をもう少し明確にします。これは会社の求人情報Webサイト用であり、約5つまたは7つのvarchar列が検索可能であり(そのうち4つはマークアップが可能です)、いつでも約150のアクティブな求人情報があります。

4

3 に答える 3

3

テキストになんらかの種類のマークアップ (HTML など) がある場合、インデックス作成と検索の際に言語学的な正確さが得られない場合があります。その場合、2 つの選択肢があります。推奨される方法は、単にテキスト データを varbinary(max) 列に格納することと、そのドキュメント タイプを示してフィルター処理できるようにすることです。これができない場合は、ニュートラル ワード ブレーカーを使用し、可能であればマークアップ データ (HTML の「br」など) をノイズ ワード リストに追加することを検討してください。

も参照してください

代替案:

于 2009-04-10T13:25:44.627 に答える
2

Luceneなどの外部全文検索ツールを使用します。

于 2009-04-10T13:14:29.550 に答える
1

そのフィールドのストライプ バージョンを別のフィールドに保存し、全文インデックス検索を使用します。削除されたフィールドは、トリガーを使用して最新バージョンに更新されます

于 2009-04-10T13:23:01.653 に答える