外国語の文字で単純な fuzzywuzzy 式を試すと、process.extractOne メソッドを使用して誤った結果が得られます (u の有無にかかわらず試しました)。
>>> choices= [u"הלכות חנוכה",u"הלכות פורים",u"הלכות סוכה"]
>>> process.extractOne("הלכות סוכה", choices)
(u'\u05d4\u05dc\u05db\u05d5\u05ea \u05d7\u05e0\u05d5\u05db\u05d4', 0)
それでも、fuzz.ratio ではスムーズに実行されます。
>>> fuzz.ratio("הלכות ראש השנה", "הלכות תעניות")
69
そして、同じコードは通常の文字にもうまく機能します:
>>> choices= ['this','that','those']
>>> process.extractOne("these", choices)
('those', 80)
何が問題なのですか?