1単語から10単語の文まで、ドキュメントではなく3,000万の異なるフレーズがあり、単語/フレーズ検索をサポートする必要があります。基本的に、contains(phrase、"'book'または'stackoverflow'")が提供するもの。
SQL Server 2005(32ビット、4 proc、4gb)のインスタンスがいくつかのフルテキストカタログに反しており、カーディナリティの高い単語検索ではパフォーマンスがひどいです。
これが物事をスピードアップするための私の考えです、おそらく誰かがガイダンスを提供することができます-
1)2008 iFTS、64ビットにアップグレードします。Sql Server2005FTSのWindowsサービスは50MBを超えることはありません。私が収集したものから、カタログインデックスを検索するためにファイルシステムキャッシュを使用します。ディスクに入力されたカタログは約300MBしかないのに、なぜこれをすべてメモリに保存できないのでしょうか。sqlserverプロセスの一部であるiFTSの新しいメモリアーキテクチャは、ここで役立ちますか?
2)カタログを複数のサーバーにスケールアウトします。リンクされたFTSサーバーへのクエリは並行して実行されますか?
3)ここではドキュメントではなくフレーズを検索しているので、SQLServerの全文検索は答えではないかもしれません。Lucene.NET?カタログインデックスをRAMドライブに配置しますか?