1

Rで必要な情報を含む巨大なXMLファイルがいくつかあります。ファイルは非常に大きい(4GB以上)ため、xmlToList()は終了せずに永遠に実行されます。RAMは16GBで十分です。私は R をよく使用しますが、XML を使用したことはありません。HTMLではありません。

library(XML)
doc <- xmlInternalTreeParse("big_file.xml")  # Works fine
doc.list <- xmlToList(doc)  # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue)  # Works fine, when I know the parameter name

xmlToList() が機能していれば、names()、str()、summary()、doc.list[[1]][1] などを使用してデータをドリルダウンし、構造を学習して、どのパラメータが含まれているか。しかし、「doc」では何をすべきかわかりません。

「ドキュメント」を xmlToList() が機能するサブツリーに分割する R 方法はありますか? それとももっと良い方法ですか?

4

0 に答える 0