私は膨大なコーパスを持っており、事前に知っている少数の用語の出現のみに関心があります。tm
パッケージを使用してコーパスから用語ドキュメント マトリックスを作成する方法はありますか?
コーパスの結果の TermDocumentMatrix をサブセット化できることはわかっていますが、メモリ サイズの制約により、完全な用語ドキュメント マトリックスを最初から作成することは避けたいと考えています。
私は膨大なコーパスを持っており、事前に知っている少数の用語の出現のみに関心があります。tm
パッケージを使用してコーパスから用語ドキュメント マトリックスを作成する方法はありますか?
コーパスの結果の TermDocumentMatrix をサブセット化できることはわかっていますが、メモリ サイズの制約により、完全な用語ドキュメント マトリックスを最初から作成することは避けたいと考えています。