2

単語が出現する順序や回数が重要でない場合、C# で 2 つの文字列間の距離を照合または計算するための最適なアルゴリズムは何ですか?

最良の手段:

  • 人間の試合にほぼ同意するだろう
  • エレガント
  • 効率的
  • スケーラブルであるため、入力文字列を他の文字列の潜在的に大きなコレクションに一致させることができます

関連する質問:

いくつかのメモ:

  • 順序と発生に依存しないため、入力は、文字の配列という意味での文字列ではなく、一意の単語のセットと考えることができます。
  • データベースソリューションを特に探しているわけではありませんが、興味深いものがあります
  • 私はこれが宿題の問題であるには年を取りすぎています ;)
4

2 に答える 2

1

単語ごとの比較で私が信じている「ダブルメタフォン」と呼ばれる方法を探してください。それは利用可能な最高のものです。さまざまな言語にもカウントされます!すごいです。

文字列を比較する場合は、コサインの類似性とともにこれを使用できます。完璧な結果が得られます。

于 2010-10-02T16:04:01.680 に答える
1

これは、標準的な情報検索アルゴリズムを適用する標準的なケースのように見えます。コサイン距離が最初に頭に浮かぶものですが、特定のケースにより適したものがあるかもしれません。これは、そのルートを掘り下げるのに適したリンクです。

http://www.miislita.com/information-retrieval-tutorial/cosine-similarity-tutorial.html

実装例:

2 つのベクトルのコサイン類似度を計算するにはどうすればよいですか?

于 2009-05-12T23:10:06.423 に答える