この text =I love apples, kiwis, oranges and bananasと searchString = がkiwis and bananasあり、 Jaccard indexと言う類似性アルゴリズムがあるとします。との類似性が最も高い部分文字列を効率的に見つけるにはどうすればよいですか。textsearchString
基本的に、私が持っているキーワードのリストに一致するテキストの部分 (テキストにはエラー、スペルミス、余分な記号やスペースが含まれています) を見つけようとしています。