scikit CountVectorizerを使用して、ドキュメントのコレクションをトークン数のマトリックスに変換しました。また、その max_features を使用しました。これは、コーパス全体で用語の頻度によって並べ替えられた上位の max_features を考慮します。
ここで、選択したコーパスを分析したいと思います。特に、選択した語彙のトークンの頻度を知りたいです。しかし、私はそれを行う簡単な方法を見つけることができません。この点で親切に私を助けてください。
scikit CountVectorizerを使用して、ドキュメントのコレクションをトークン数のマトリックスに変換しました。また、その max_features を使用しました。これは、コーパス全体で用語の頻度によって並べ替えられた上位の max_features を考慮します。
ここで、選択したコーパスを分析したいと思います。特に、選択した語彙のトークンの頻度を知りたいです。しかし、私はそれを行う簡単な方法を見つけることができません。この点で親切に私を助けてください。