388

文字列がPythonで別の文字列に似ている確率を取得するにはどうすればよいですか?

0.9 (つまり 90%) などの 10 進数値を取得したい。できれば標準の Python とライブラリを使用します。

例えば

similar("Apple","Appel") #would have a high prob.

similar("Apple","Mango") #would have a lower prob.
4

14 に答える 14

3

ほとんどのテキスト類似度メソッドとその計算方法は、次のリンクで確認できます: https://github.com/luozhouyang/python-string-similarity#python-string-similarity ここにいくつかの例があります。

  • 正規化、メトリック、類似度、および距離

  • (正規化された) 類似度と距離

  • メートル法による距離

  • 帯状疱疹 (n グラム) ベースの類似性と距離
  • レーベンシュタイン
  • 正規化されたレーベンシュタイン
  • 加重レーベンシュタイン
  • ダメラウ・レーベンシュタイン
  • 最適な文字列配置
  • ジャロ・ウィンクラー
  • 最長共通部分列
  • メトリックの最長共通部分列
  • Nグラム
  • シングル(n-gram)ベースのアルゴリズム
  • Qグラム
  • コサイン類似度
  • ジャカードインデックス
  • Sorensen-Dice 係数
  • 重複係数 (つまり、Szymkiewicz-Simpson)
于 2020-04-09T14:38:34.620 に答える