テキストファイルを読み取るとき、これらの文字を読み取ります。コンソールに出力すると、空白または �:
['\x80', '\xc3', '\x94', '\x99', '\x98','\x9d', '\x9c', '\xa9', '\xa6', '\xe2']
これらの \xHEX 文字は何ですか? これらの文字を検索するためのテーブルへのリンクはありますか?
解決済み:
テキストファイルではなくascii
、Unicodeutf8
ファイルでした。そのため、文字を正しく取得できませんでした。
Java の場合:
import java.io.*
File infile = new File('\home\foo\bar.txt');
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(infile), "UTF8"));
while ((str = in.readLine()) != null) {
System.out.println(str);
}
system.out.println
不満がある場合は、次を試してください:
PrintStream out = new PrintStream(System.out, true, "UTF-8");
out.println(str);
Python の場合は、単純に次のようにします。
import codecs
infile = '\home\foo\bar.txt'
reader = codecs.open(infile,'r','urf8')
for l in reader:
print ln