0

R の quanteda パッケージと、R とパッケージの両方に最新バージョンを使用しています。私は何百万もの文書のコーパスを持っています。

各ドキュメントが日付の docvar を持つ quanteda から生成された DFM があるとします。1 日に何千ものドキュメントが生成されますが、ドキュメントに適用される DFM を日ごとに取得したいと考えています (各用語の単語数の合計を日ごとに取得するため)。quanteda は data.table を使用して構築されていることを知っているので、これを行うことができるはずですが、「Quanteda の概要」または StackOverflow では、これを行うためのクリーンな方法を提供するものはほとんど見つかりませんでした。

助言がありますか?

4

1 に答える 1