同様の文が最も近い値を持つ必要があるように、一意の数値を使用してどのように文を表すことができますか。
例 。文1== スミスがLAを訪問。文2== ジョンはカリフォルニアを訪れます。
これら 2 つのセンテンス 1 と 2 の場合、これら 2 つのセンテンスに類似のメッセージが含まれていることを表すには、数値がより近い必要があります。
同様の文が最も近い値を持つ必要があるように、一意の数値を使用してどのように文を表すことができますか。
例 。文1== スミスがLAを訪問。文2== ジョンはカリフォルニアを訪れます。
これら 2 つのセンテンス 1 と 2 の場合、これら 2 つのセンテンスに類似のメッセージが含まれていることを表すには、数値がより近い必要があります。
あなたは文のセマンティクス、自然言語処理を理解することについて話しているので、簡単な作業ではありません。文章データが非常に 厳密な構造と類似のパターンに従っている場合を除きます。あなたが求めていることは、おそらく現在の最先端を超えており、確かに博士レベルの研究レベルにあると思います.
私が考えることができる唯一のアプローチは、意味的に認識された有向グラフにマップされた既知の辞書を使用して自然言語圧縮を使用することです。
次に、各文 (グラフ上のパス) が別の文からどれだけ離れているかを評価し、累積的な重みを割り当てることができます。