の問題で立ち往生していxsltprocます。
文字列"TEST TEST"のみが含まれるファイルをWord 2010as "Web page in a single file"( Click me for source ) で保存しました。
文字列を XML から取得したものに置き換えたいので、xsltproc良いと思いました。
mhtファイルは適切な xml 形式のファイルではないため、既に行き詰まっています。
私の質問xsltprocは次のとおりです。
- xsltproc が次のような xml エンティティを受け入れるようにするにはどうすればよい
<meta name=3DGenerator content=3D"Microsoft Word 14">ですか?3D外部の引用はそれを怒らせます。 - xml フォーマットのない部分をスキップできますか? 最初の行のように:
MIME-Version: 1.0
Content-Type: multipart/related; boundary="----=_NextPart_01CDFED3.EFE26A80"
..
前もって感謝します