difflib ライブラリを試しています。文字列を含む L_1 と L_2 の 2 つのリストがあります。それらのシーケンスが類似しているかどうかを知りたいです (順序は重要ではありません)。
L_1 = ["Bob", "Mary", "Hans"]
L_2 = ["Bob", "Marie", "Háns"]
大丈夫なはず。しかし
L_1 = ["Nirdosch", "Mary", "Rolf"]
L_2 = ["Bob", "Marie", "Háns"]
大丈夫ではないはずです。
最初のリスト L_1 を反復処理し、メソッドによって L_1 のすべての要素を一致させるというアイデアを思いつきました
difflib.get_close_matches()
2 番目のリスト L_2 に対して。より大きな比率の一致があった場合、0.7 としましょう。L_2 からそれを削除して続行します。しかし、私はそれが良い計画であることを疑います。より良いものはありますか?