WordNet が 2 つの単語間の意味的距離を提供できることは知っていますが、複数の単語を含む句についてはどうでしょうか。
2 つの異なるフレーズ間の意味論的距離を測定できるオープン ライブラリはありますか?
WordNet が 2 つの単語間の意味的距離を提供できることは知っていますが、複数の単語を含む句についてはどうでしょうか。
2 つの異なるフレーズ間の意味論的距離を測定できるオープン ライブラリはありますか?
単語間の意味的類似性 (距離) にリンクされているのは、概念間の類似性の概念です。一般的なアプローチは、単語の袋を概念の袋に減らすために、テキスト/フレーズで表現された概念を抽出することです。このようなプロセスは自明ではありませんが (多義性、曖昧性など)、生物医学ドメインの MetaMap などのドメイン固有のツールを使用して、構造化されていないテキストをオントロジー/用語で定義された明確な概念/用語にマッピングできます。
したがって、このような概念の袋は、意味グラフ (オントロジー、WordNet など) を利用してテキスト/フレーズ間の類似性を評価するために使用できます。Semantic Measures Library (SML) を使用して、概念を構造化するセマンティック グラフを考慮して、このような概念のバッグ間の類似性または距離を推定できます。ライブラリはJava、オープンソースで開発され、幅広い対策を実装しています。コマンド ライン インターフェイスを使用して意味的類似性を計算するためのツールキットも提供されています。
SML とツールキットは、専用の Web サイト http://www.semantic-measures-library.orgからダウンロードできます。
これらが役立つことを願っています