そのような文字列が 2 つある場合
s1 = "This is a foo bar sentence ."
s2 = "This sentence is similar to a foo bar sentence ."
そして、文字列をこの形式になるように分割したい
x1 = ["This":1,"is":1,"a":1,"bar":1,"sentence":1,"foo":1]
x2 = ["This":1,"is":1,"a":1,"bar":1,"sentence":2,"similar":1,"to":1,"foo":1]
文字列の単語を分割してカウントし、各文字列が単語を表し、数字が文字列内のこの単語の数を表すペアにします。