特定のタグの間に、解析したくないテキストがあり、タグが壊れている可能性がある XML ファイルを解析しています。Perl の xml 解析用に利用可能なモジュールの 1 つを使用して、そのテキストを解析しないことを選択するにはどうすればよいですか?
前もって感謝します。
XML が壊れている (つまり整形式でない) 場合、XML パーサーを使用することはできません。それが特徴です。したがって、最初に修正する必要があります。
XML が整形式である場合は、オプションとともにXML::Twigignore_elts
を使用できます。無視された要素が存在しなかったかのように XML が表示されます。
または、XML が「あまり壊れていない」場合は、XML::Liberalを試すことができます。これで対処できる可能性があります。か否か...
XHTML、HTML、またはそれに近いものがあれば、XML::LibXML または XML::Twig のいずれかを適切な解析メソッドとともに使用できます。
幸運を...