SeatGeek のFuzzyWuzzy String Matching モジュールを使用しています。
token_set_ratio 検索アルゴリズムを使用すると、大文字と小文字のわずかな違いで結果が大きく異なることがわかりました。
たとえば、ファイルで「I am eating」というフレーズを探している場合、100% 一致します。しかし、フレーズが「私は食べています」の場合、1 文字の変更だけで 65% の一致が得られます。
アルゴリズムの大文字と小文字を区別しないようにする方法はありますか?