python - HTMLParser:HTML ドキュメントの不正な形式の開始タグの処理

翻译自：https://stackoverflow.com/questions/12070453 2012-08-22T09:47:31.163

306 次

1

Python でクラスを使用しHTMLParserて HTML ドキュメントを解析しています。しかし、「開始タグの形式が正しくありません」というエラーが時々発生します。これを処理して、不正な開始タグを削除し、残りのドキュメントを解析する方法はありますか?

0 に答える 0