ASP.NET ページ、ユーザー コントロール、およびマスター ページから要素を取得LINK
し、それらのコンテンツを取得して、作業中のユーティリティでこれらのファイルに更新された値を書き戻す必要があります。META
これらの要素だけを取得するために正規表現を使用することもできますが、その方法にはいくつかの問題があります。
- 入力ファイルの多くには、破損した HTML が含まれていると予想されます (欠落している要素や順序が正しくない要素など)。
SCRIPT
有効な要素のように見えるコメントや VBScript/JavaScript などを含む要素。META
IE 条件付きコメントとLINK
IE 条件付きコメント内の要素を特別にケース化できるようにする必要があります- HTML が通常の言語ではないことは言うまでもありません
私は .NET の HTML パーサーについて調査を行い、多くの SO の投稿やブログでHTML Agility Packを推奨しています。これまで使用したことがなく、壊れた HTML や HTML フラグメントを解析できるかどうかもわかりません。(たとえば、HEAD
何らかのコンテンツを含む要素のみを含むユーザー コントロールを想像してください。 noHTML
またはBODY
.) ドキュメントを読むことができることはわかっていますが、誰かがアドバイスしてくれれば、かなりの時間を節約できます。(ほとんどの SO 投稿には、完全な HTML ページの解析が含まれます。)