0
  1. 10 個の txt ファイルがあり、これらのファイルのコーパスを生成しました。
  2. コーパスを作成したら、ベクトル空間モデルを生成する必要があります。
  3. VSMの場合、コーパスを前処理して、ストップワード、数字、句読点などを削除しました...
  4. 次に、コーパスを読み取り、コーパスに存在する各キーワード/文字/単語に対して類義語を生成する必要があります。
  5. wordnet を使用して、テキスト コーパスに存在する各ファイルの同義語を取得できません。

各単語の同義語を生成し、それらのキーワードを同じファイルに追加したい..

4

0 に答える 0