1

「Mais、tu n'as pas fait tesdevoirs?!」のような文でいっぱいのテキストファイルがいくつかあります。-\ u00c9l \ u00e8ve:「ベンノン」

すべての発音区別符号をutf8形式で復元する簡単な方法(スクリプトまたはユーティリティ)はありますか?(期待される結果:Élève: "Ben non")

sedを使用して手動で行うこともできますが、テキストファイルには複数の言語に固有の発音区別符号が含まれているため、時間がかかりすぎます。

どうもありがとうございます

4

2 に答える 2

1

見つけた...

python -c "print (open('filetoconvert.txt','rb').read().decode('unicode-escape').encode('utf-8'))"
于 2012-06-30T18:53:13.073 に答える
0

Java JDKがインストールされている場合は、native2asciiUnicodeエスケープとの間でファイルを変換するために呼び出されるユーティリティプログラムがあります。例えば:

native2ascii -reverse filetoconvert.txt > converted.txt
于 2012-07-02T09:29:18.520 に答える