database - キーワードを検索する最速の方法。あらゆる言語、あらゆるシステム

Question

毎日、500 万個ほどのユニークなキーワードがあり、それぞれのインプレッション数があります。これらのキーワードを特定の単語で検索できるようにしたいので、たとえば「ipod nano 4GB」を持っている場合、「ipod」、「nano」、または「4GB」を検索するとそれを引き出すことができるようにしたいと考えています。mySQL は、私が望むほど多くのデータを処理できないようです。Berkeley を試しましたが、行が多すぎるとクラッシュするようで、速度が低下します。アイデア？

score 2 · Accepted Answer

Xapian 検索エンジンライブラリには非常に満足しています。あなたのシナリオではやり過ぎのように思えますが、データをmemcachedのような大きなハッシュテーブルに入れたいだけかもしれません。

score 1 · Accepted Answer

mssql でフリーテキストを試すことができます。 http://msdn.microsoft.com/en-us/library/ms177652.aspx

クエリの例:

SELECT TOP 10 * FROM searchtable 
INNER JOIN FREETEXTTABLE(searchtable, [SEARCH_TEXT], 'query string') AS KEY_TBL
ON searchtable.SEARCH_ID = KEY_TBL.[KEY] 
ORDER BY KEY_TBL.RANK DESC

ジョシュ

score 1 · Accepted Answer

Luceneインデックスが機能する場合があります。以前はかなり大きなデータセットに使用していました。Java で開発されていますが、.NET バージョンもあります。

score 0 · Accepted Answer

MySQL で全文検索を試しましたか? LIKE 比較で試してみると、遅い理由がわかります :)。

score 0 · Accepted Answer

そのワークロードと検索パターンは、統合された全文検索機能を備えた PostgreSQL にとっては些細なことです (8.4 で統合され、現在 RC ステータスになっています。それ以前は contrib モジュールです)。

database - キーワードを検索する最速の方法。あらゆる言語、あらゆるシステム

5 に答える 5

Related

Reference