この質問を「mht」ファイルの解析の開始点として使用できましたが、アンカータグ(例:)の「3D」<a href=3D"[my anchor]">[anchor text]></a>
はすべての内部リンクと埋め込み画像を壊します。パーサーで「=3D」を「=」(例:)に置き換えることができます。これは<a href="[my anchor]">[anchor text]></a>
正常に機能しているように見えますが、その「メタマークアップ」の目的を理解したいと思います。
「.docx」から「.mht」にエクスポートすると、ほとんどの(すべてではないにしても)html属性の右側に「3D」が追加されるのはなぜですか?それらを処理するためのより良い方法、またはそれらを交換するときに使用するためのより良い正規表現はありますか?