- 10 個の txt ファイルがあり、これらのファイルのコーパスを生成しました。
- コーパスを作成したら、ベクトル空間モデルを生成する必要があります。
- VSMの場合、コーパスを前処理して、ストップワード、数字、句読点などを削除しました...
- 次に、コーパスを読み取り、コーパスに存在する各キーワード/文字/単語に対して類義語を生成する必要があります。
- wordnet を使用して、テキスト コーパスに存在する各ファイルの同義語を取得できません。
各単語の同義語を生成し、それらのキーワードを同じファイルに追加したい..