3

1,000 個の HTML ファイルのコレクションがあり、それらをいくらかトリミングする必要があります。印刷できるようにきれいにするために、<body></body>1つを除いて、それらの領域内のすべてのタグを削除する必要があります。<div.pg>余分なものはナビゲーション リンクであり、印刷が乱雑になり、ページがより多くの紙を占有します。内容が同じではないため、コードの抜粋を見つけて置き換えることはできませんが、タグは同じ<table>で、特定のクラスごとに 3 つのタグを削除する必要があります。バッチ HTML ファイル内の特定のタグを操作しますか?

この仕事を行うためのバッチ処理技術またはソフトウェアはありますか? Windowsでの簡単な解決策は何ですか?

4

2 に答える 2

2

あなたが持っている各h​​tmlページでxslt変換を使用します。バッチは、html ファイルを操作するためのツールではありません。バッチを「マネージャー」として使用して、必要なファイルを xsl 変換に渡すことができます。また、Windowsには基本的なmsxmlユーティリティがあり、ダウンロードしてマシンにインストールできます: http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=21714

それが私がそれをする方法です。より多くのオプションがあると確信しています。

于 2011-09-27T20:58:18.230 に答える
0

XHTML の場合、XSLT を使用して HTML を「別の」形式に変換できます。ここで例を探します: http://www.w3schools.com/xsl/またはここ: http://help.hannonhill.com/discussions/how-do-i/269-strip-specific-html-tag-in- xslt

于 2011-09-27T21:03:19.743 に答える