Python でクラスを使用しHTMLParser
て HTML ドキュメントを解析しています。しかし、「開始タグの形式が正しくありません」というエラーが時々発生します。これを処理して、不正な開始タグを削除し、残りのドキュメントを解析する方法はありますか?
Python でクラスを使用しHTMLParser
て HTML ドキュメントを解析しています。しかし、「開始タグの形式が正しくありません」というエラーが時々発生します。これを処理して、不正な開始タグを削除し、残りのドキュメントを解析する方法はありますか?