フォーラムなどの文字列を検索する最良の方法は何ですか? 私は恐ろしい文字列検索を見てきましたが、通常、より多くの文字列を使用するほど悪くなります。
タイトル検索も実装するかもしれないので、タイトルを検索する方法が文字列の本体よりも優れている場合は、それも聞いてみたいです
全文検索にLucene (Java) (またはLucene.Net )を使用する方法を見てみましょう。Lucene は、タイトル、テキスト、作成者などでドキュメントのインデックス作成と検索を行うことができるテキスト マイニング API です。Lucene の Ruby ポート (Ferret またはact_as_ferret ) を使用して、特殊なメーリング リストのインデックスを作成したところ、非常にうまく機能することがわかりました。良い。
ほとんどの場合、"Boyer Moore" 文字列検索アルゴリズムを使用することをお勧めします。
ウィキペディアでそれについて読むことができます:
http://en.wikipedia.org/wiki/Boyer%E2%80%93Moore_string_search_algorithm
また、自分で実装することに興味がない場合は、見るべき多くのサンプル コードもあります。
パフォーマンスがまったく重要でない場合は、正規表現を使用することに同意します。
「フォーラム」が何を意味するのか正確にはわかりませんが、正規表現は始めるのに適した場所かもしれません.
一般的すぎる?