database - キーと値のペアのアルゴリズム。キーは文字列です

Question

100,000 から 100Million にスケールする可能性のある文字列またはフレーズの膨大なリストがあるという問題があります。フレーズを検索すると、データベースへの ID またはインデックスが表示され、さらに操作を行うことができます。これにハッシュテーブルを使用できることは知っていますが、文字列に基づいてインデックスを生成するのに役立ち、オートコンプリートなどの他の機能にも役立つ他のアルゴリズムを探しています.

いくつかの SO スレッドに基づいてサフィックスツリー/配列を読みましたが、それらは目的を果たしますが、余裕があるよりも多くのメモリを消費します。これに代わるものはありますか？

私の検索は、何百万もの文字列の巨大なリストにしか含まれていないためです。lucene などの検索エンジンに関心のないドキュメントやウェブページはありません。

また、転置インデックスについてもお読みください。役に立ちますが、どのアルゴリズムを勉強する必要がありますか?.

score 1 · Accepted Answer

このデータベースインデックスが MS SQL Server 内にある場合、SQL フルテキストインデックス作成で良い結果が得られる可能性があります。他の SQL プロバイダーにも同様の機能があるかもしれませんが、私はそれらを支援することはできません。

チェックアウト: http://www.simple-talk.com/sql/learn-sql-server/understanding-full-text-indexing-in-sql-server/

と

http://msdn.microsoft.com/en-us/library/ms142571.aspx

database - キーと値のペアのアルゴリズム。キーは文字列です

1 に答える 1

Related

Reference