よく知られている Reuters-21578 データセットを使用していくつかの作業を行おうとしていますが、コーパスに sgm ファイルをロードする際に問題が発生しています。
現在、私はコマンドを使用しています
require(tm)
reut21578 <- system.file("reuters21578", package = "tm")
reuters <-Corpus(DirSource(reut21578),
readerControl = list(reader = readReut21578XML))
すべてのファイルをコーパスに含めようとすると、次のエラーが表示されます。
Error in DirSource(reut21578) : empty directory
私が間違っている可能性がある場所はありますか?