次のような、リテラル (エスケープされていない) 電子メール タグを含むページを読み込むのに問題があります。
<html>
<head>
<title>Testing</title>
</head>
<body>
<p>Testing testing.</p>
<p>This is an email address for <joe@somewhere.com></p>
</body>
</html>
そのブロックにヒットすると、解析が失敗します。
ファイル "/tools/oss/packages/x86_64-rhel5/python/2.7.1/lib/python2.7/HTMLParser.py"、115 行目、エラー発生 HTMLParseError(message, self.getpos()) HTMLParseError: 不正な開始タグ、行 748、列 82
私が最初にこれに遭遇したとは信じられませんが、ヘルプや有用なドキュメントがすぐに見つかりません。明らかな何かが欠けていますか?
ありがとう、
-- ポール