まあ、これは簡単な質問かもしれません。率直に言って、私はそれらすべてのエンコーディングと少し混乱しています。
01234.txtiso-8859-1というファイルがあるとします。
私がする時:
iconv --from-code=iso-8859-1 --to-code=utf-8 01234.txt > 01234_utf8.txt
それは私に望ましい結果を与えます、しかし私がpythonとサブプロセスを使って同じことをするとき:
import subprocess
p0 = subprocess.Popen([<here the same command>], shell=True)
p0.wait()
ほぼ同じ結果が得られますが、新しいファイルが欠落しています。たとえば、最後のファイルと最後のファイルの前の行の一部です。
ここに両方のファイルの最後の3行があります:iconv result:
795719000 | MARIA TERESA MARROU VILLALOBOS | 107
259871385 | CHRISTIAM ALBERTO SUAREZ VILLALOBOS | 107
311015100 | JORGE MEZA CERVANTES | 09499386
Pythonの結果:
795719000 | MARIA TERESA MARROU VILLALOBOS | 107
259871385 | CHRISTIAM
編集:私が使用しようとしたPythonファイルcoding: utf-8でcoding: iso-8859-1(同時に両方ではありません)。
編集:私はbpythonでコーデックを使用しましたが、それはうまく機能します。ファイルから使用すると、望ましくない結果が得られます。
編集:私はLinux(Ubuntu 9.10)とPython2.6.2を使用しています。
助言がありますか?