1

データベースに保存されている大きなテキスト(5000語以上)を解析し、名前を検索するための最良の方法は何ですか?テキストは多言語になります。

私の最初のアイデアは、大きな文字で始まるすべての単語をデータベースと比較するという、かなり単純なアプローチです。ただし、これは小文字のみを含むテキストでは失敗する傾向があります。

編集 テキストは静的ではなく動的です(例:Webサイト)

一番

Mac

4

4 に答える 4

4

RDBMSに組み込まれているフルテキストインデックス機能を使用します。

全文検索(SQL Server)

MySQL全文検索機能

OracleTextを使用した全文索引付け

于 2009-09-20T15:10:53.057 に答える
0

Aho-Corasickアルゴリズムを使用して、一致させようとしている名前で辞書を作成できます。これは、テキスト内のトークンの数と一致した名前の数で線形です。

于 2009-09-20T15:11:06.653 に答える
0

名前の辞書が必要になります。

または、非常に多くの名前のコレクションを知っているhttp://www.opencalais.com/を試すことができます。

于 2009-09-20T15:13:27.683 に答える
0

ここで、大きなテキスト内の複数の文字列を置き換える方法を作成しました。多くの文字列を置き換えるためのより良い方法-C#での難読化。おそらく、同じ原則を使用できます。

于 2009-09-20T15:14:02.280 に答える