xmlファイルを解析するPythonスクリプトがあり、次のエラーが返されます。
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 614617: character maps to <undefined>
解析しようとしているxmlドキュメント内に不正な文字が含まれているため、エラーが発生していると確信していますが、読み取っているこの特定のxmlファイルを直接修正するためのアクセス権がありません。
これらの文字がスクリプトをつまずかず、エラーなしで解析を継続できるようにすることはできますか?
これは、tatがxmlを読み取ってデコードするスクリプトの一部です。
def ReadXML(self, path):
self.logger.info("Reading XML from %s" % path)
codec = "Windows-1252"
xmlReader = open(path, "r")
return xmlReader.read().decode(codec)