次のようなデータを含むファイル file.txt があります。
<z:row ows_Req_Name1='John' ows_ReqPriority='High' ows_ReqDate='2012-10-10' />
<z:row ows_Req_Name1='Jack' ows_ReqPriority='Low' ows_ReqDate='2012-11-10' />
<z:row ows_Req_Name1='John' ows_ReqDate='2012-12-10' />
すべての行に必要な情報がすべて含まれているわけではありません。たとえば、上記の最後の行には、他の行のように ReqPriority のエントリがありません。を使用してデータをデータフレームに分割します。
data.frame(do.call(rbind,strsplit(readLines('file.txt'),'ows_',fixed=T)))
しかし、一部の行でエントリが欠落しているため、データフレームが正しく出力されません。
これを df にエクスポートし、欠損値を NA で埋める方法についての提案。
Req_Name1 ReqPriority ReqDate
John High 2012-10-10
Jack Low 2012-11-10
John NA 2012-10-10