私は fasttext を使用して、患者の医療テキストのメモを入院の決定 (分類) に関連付けています。これは感情分析に似ています。それなりの精度が出ています。ただし、モデルの精度をさらに向上させるために活用したい構造化された定量的データもあります。計画では、各患者のテキスト メモ (テキスト メモ全体に対して 1 つのベクトル) の単語ベクトル埋め込みを抽出し、それを患者の定量的データと組み合わせて、より優れたパフォーマンスの別の分類器を構築することでした。
驚いたことに、定量的データを追加しなくても、上で学習したモデルを使用して fasttext によって提供される単語ベクトルを使用して、fasttext 分類モデルのパフォーマンスに匹敵する別の分類器を構築することはできません。
トレーニング済みの fasttext モデルと、最初にモデルのトレーニングに使用したものと同じテキスト ノートを使用して、get word vector 関数を呼び出しているだけです。
私は何か間違ったことをしていますか?任意の入力に感謝します。R で fastTextR パッケージを使用しています。ありがとうございます。