-1

テキストファイルを読み取るとき、これらの文字を読み取ります。コンソールに出力すると、空白または �:

['\x80', '\xc3', '\x94', '\x99', '\x98','\x9d', '\x9c', '\xa9', '\xa6', '\xe2']

これらの \xHEX 文字は何ですか? これらの文字を検索するためのテーブルへのリンクはありますか?

解決済み:

テキストファイルではなくascii、Unicodeutf8ファイルでした。そのため、文字を正しく取得できませんでした。

Java の場合:

import java.io.*
File infile = new File('\home\foo\bar.txt');
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(infile), "UTF8"));
while ((str = in.readLine()) != null) {
System.out.println(str);
}

system.out.println不満がある場合は、次を試してください:

PrintStream out = new PrintStream(System.out, true, "UTF-8");
out.println(str);

Python の場合は、単純に次のようにします。

import codecs
infile = '\home\foo\bar.txt'
reader = codecs.open(infile,'r','urf8')
for l in reader:
  print ln
4

3 に答える 3

2

すべての Unicode 文字へのリンクは次のとおりです。

http://en.wikipedia.org/wiki/List_of_Unicode_characters

また、Eclipse を使用している場合は、プロジェクトの「テキスト ファイルのエンコード」が UTF-8 に設定されていることを確認してください。

Project->properties->resources->Text File Encoding.

キリル文字でも同様の問題がありました:)

于 2013-07-22T08:59:21.507 に答える