Web ページのグループをクロールするアプリケーションを作成しています。ページのソース コード全体を取得するのではなく、すべてのコンテンツを取得して保存し、データベース内にプレーン テキストとしてページを保存できるようにしたいと考えています。コンテンツは他のアプリケーションで使用され、ユーザーが読むことはないため、人間が完全に判読できる必要はありません。
最初は、正規表現を使用することを考えていましたが、Web ページの有効性を制御することはできず、正規表現がコンテンツを提供しない可能性が非常に高くなります。
文字列内にソース コードがある場合、そのソース コードの文字列を C# の単なるコンテンツに変換するにはどうすればよいですか?