Web クローラーとして web.response メソッドを使用して情報を収集しています。それを文字列にまとめてテキスト ファイルに保存します。次に、正規表現を使用してそのテキスト ファイルを検索します。問題は、正規表現を使用してそのテキスト ファイルを検索すると、テキスト ファイルにランダムな改行が多数含まれているため、適切に検索できないことです。
私の質問は、「web.response メソッドで取得した XML (HTML) ドキュメントを、テキスト ファイルに保存する前に適切にフォーマットして、テキストにランダムなスペースや改行が入らないようにする方法はありますか?フォーマットされていない HTML をここに投稿してください。