Rで必要な情報を含む巨大なXMLファイルがいくつかあります。ファイルは非常に大きい(4GB以上)ため、xmlToList()は終了せずに永遠に実行されます。RAMは16GBで十分です。私は R をよく使用しますが、XML を使用したことはありません。HTMLではありません。
library(XML)
doc <- xmlInternalTreeParse("big_file.xml") # Works fine
doc.list <- xmlToList(doc) # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue) # Works fine, when I know the parameter name
xmlToList() が機能していれば、names()、str()、summary()、doc.list[[1]][1] などを使用してデータをドリルダウンし、構造を学習して、どのパラメータが含まれているか。しかし、「doc」では何をすべきかわかりません。
「ドキュメント」を xmlToList() が機能するサブツリーに分割する R 方法はありますか? それとももっと良い方法ですか?