0

こんにちは壊れたxml内に存在するxmlの有効な部分を使用する方法

例:<nodea>
<nodeb> DATA </ nodeb
<nodec> DATA </ nodec>

上記では、nodeaが閉じられていないため、これは壊れたxmlですが、nodebとnodecはnodea内に存在する有効なXmlです。そのため、libxml2を使用せずに、それらの内部のデータを取得できますか。

4

1 に答える 1

0

解析する前に、ヒューリスティックハックによってファイルを修正する必要があります。

$ cat broken.xml 
<nodea>
<nodeb>DATA</nodeb 
<nodec> DATA </nodec>
$ < broken.xml sed 's%</nodeb[^>]%</nodeb>%'
<nodea>
<nodeb>DATA</nodeb>
<nodec> DATA </nodec>
于 2012-04-04T09:48:30.607 に答える