この text =I love apples, kiwis, oranges and bananas
と searchString = がkiwis and bananas
あり、 Jaccard indexと言う類似性アルゴリズムがあるとします。との類似性が最も高い部分文字列を効率的に見つけるにはどうすればよいですか。text
searchString
基本的に、私が持っているキーワードのリストに一致するテキストの部分 (テキストにはエラー、スペルミス、余分な記号やスペースが含まれています) を見つけようとしています。