3

要件に合った文字列一致アルゴリズムを見つけるのに苦労しています。

省略されていない形式の文字列の非常に大きなデータベースがあり、任意の省略形に一致させる必要があります。文字間に文字がない実際の部分文字列である文字列も一致し、スコアが高くなります。

例: 一致する単語が「download」で、「down」、「ownl」、「dl」の順に検索した場合、「down」、「ownl」、「dl」の順に一致するスコアが最も高くなります。 dl」。

アルゴリズムは、速度と検索対象の多数の文字列に対して最適化する必要があり、一致するアイテム文字列のリストを取得できるようにする必要があります (データベースに「ダウンロード」と「アップロード」の両方を追加した場合、 「ロード」を検索すると、両方が返されます)。メモリは依然として重要ですが、速度ほど重要ではありません。

何か案は?私はこれらのアルゴリズムのいくつかについて多くの調査を行いましたが、これらすべての条件は言うまでもなく、略語に触れるものさえ見つけられませんでした!

4

1 に答える 1

0

Peter Norvig のスペル チェッカーを何らかの方法でこの問題に適用できるのではないかと思います。

これは私がまだ解決していないストレッチですが、知っておく価値のある非常にエレガントなソリューションです。

于 2010-02-21T03:53:22.267 に答える