都市ごとの経済学と高度に相関する分類問題があります。人口、収入の中央値、雇用などの非構造化データをフリー テキストで持っています。テキスト マイニングを使用して、テキスト内の値を理解し、分類を行うことはできますか。ほとんどのテキスト マイニング記事を読んだことがあれば、キーワードまたはフレーズ カウントを使用して分類を行います。テキストの意味とテキストの頻度で分類できるようにしたいと思います。これは可能ですか?
ところで、私は現在 RapidMiner と R を使用しています。
前もって感謝します、ジョン