ws4j を使用して、2 つの文の類似度を計算したいと考えています。WS4Jのオンライン デモ @ WS4J Online demoを使用しています。
WS4J が提供するデフォルトの例文を使用しています。文を入力して類似度の計算ボタンを押すと、次の出力が得られます。
ここでは、文の個々のトークン間の類似性を取得しています。
ここからさらに先に進むにはどうすればよいですか。これらの 2 つの文の類似性を示す単一の値 (0.5 または 0.8 など) を取得したいと考えています。
ここから先に進む標準的な方法はありますか、それとも独自のアルゴリズムを作成する必要がありますか?