文字列にhtmlタグのouterHTMLがあり、bodyタグの内側のHTMLを抽出したいと思います。この関数はC#で使用されるため、RegEx Asp.net C#を使用して(文字列から)BODY htmlタグ内のすべてを取得する方法と同様に、HTML /JavaScriptDom機能にアクセスできません。
LoadHtml変換を実行するときに発生するHTMLドキュメントの違いのため、HTMLアジリティルートは機能しません。元のHTML本文とライブサイトで更新されるHTML本文の違いをキャプチャします。これらの違いを元の本文innerHTMLと比較してほしい。HTMLのouterHTMLからbodyinnerHTMLを抽出したい理由は、データ転送のスペースを確保するためです(それぞれの送信ではなく、html、head、bodyの1つの送信)。
理想的には、これはbodyタグの属性など、あらゆるエッジケースを処理します。無効なhtmlはbodyタグなどです。