python - 奇妙な文字を含むログファイルを処理する際のエラーを回避する

翻译自：https://stackoverflow.com/questions/18052155 2013-08-05T06:54:42.067

450 次

ログファイルを 1 行ずつ分析する Python 3 スクリプトを開発しています。分析するログファイルをパラメーターとして受け取り、それを処理します。

parser = argparse.ArgumentParser(description="logfile analysis")
    parser.add_argument("logfile", help="log file to analyse")
    args = parser.parse_args()
    with open(args.logfile, 'r') as f:
        for line in f:
            (... processing ...)

ただし、ログファイルに非常に奇妙な文字が含まれている場合があります。これらの文字をここにコピーして貼り付ける方法さえ知らないので、テキストエディターからのスクリーンショットを次に示します。ログに奇妙な文字が表示される

その場合、次の例外があります。

Traceback (most recent call last):
  File "loganalysis.py", line 525, in <module>
    main()
  File "loganalysis.py", line 512, in main
    for line in f:
  File "/usr/lib/python3.2/codecs.py", line 300, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 2265: invalid start byte

行の内容を処理する前にサニタイズしたり、スクリプトをクラッシュさせずに単に無視したりするにはどうすればよいですか?

ありがとう！

python - 奇妙な文字を含むログ ファイルを処理する際のエラーを回避する

2 に答える 2

Related

Reference

python - 奇妙な文字を含むログファイルを処理する際のエラーを回避する