通常、単語のバッグアプローチを使用してテキストから特徴を取得し、単語をカウントして、次のようにtf-idf値などのさまざまな測定値を 計算します。分類に数値特徴として単語を含める方法
しかし、私の問題は異なります。単一の単語から特徴ベクトルを抽出したいと思います。たとえば、ジャガイモとフライドポテトはどちらもジャガイモでできているため、ベクトル空間で互いに接近していることを知りたいと思います。ミルクとクリームも近くにあり、熱くて暖かく、石で固いなどです。
この問題は何と呼ばれていますか?たくさんの文書を見るだけで、単語の類似点や特徴を学ぶことができますか?
英語で実装しないので、データベースは使えません。