私はHTML::TreeBuilder::XPath
、複雑な HTML ドキュメントを解析してから編集してから、ディスクに書き戻すために使用しています。私が直面している問題は、 HTML コンテンツ ( )を解析しようとすると、ブロック<link...>
内のタグが拒否されることです。<body>
$tree->parse_content($page);
HTML::Parse: 本文
<link>
のヘッダー要素
これらは HTML5 までは違法でしたが、現在は合法のようです。警告がスローされたとしても、ツリービルダーにこれが合法であることを伝える方法、またはそれを受け入れるようにする方法を知っている人はいますか? これらは出力段階に到達せず、レイアウトを台無しにしています。