Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
こんにちは壊れたxml内に存在するxmlの有効な部分を使用する方法
例:<nodea> <nodeb> DATA </ nodeb <nodec> DATA </ nodec>
上記では、nodeaが閉じられていないため、これは壊れたxmlですが、nodebとnodecはnodea内に存在する有効なXmlです。そのため、libxml2を使用せずに、それらの内部のデータを取得できますか。
解析する前に、ヒューリスティックハックによってファイルを修正する必要があります。
$ cat broken.xml <nodea> <nodeb>DATA</nodeb <nodec> DATA </nodec> $ < broken.xml sed 's%</nodeb[^>]%</nodeb>%' <nodea> <nodeb>DATA</nodeb> <nodec> DATA </nodec>