utf-8 - 発音区別符号をutf8形式で復元する-Linux

Question

「Mais、tu n'as pas fait tesdevoirs?!」のような文でいっぱいのテキストファイルがいくつかあります。-\ u00c9l \ u00e8ve：「ベンノン」

すべての発音区別符号をutf8形式で復元する簡単な方法（スクリプトまたはユーティリティ）はありますか？（期待される結果：Élève： "Ben non"）

sedを使用して手動で行うこともできますが、テキストファイルには複数の言語に固有の発音区別符号が含まれているため、時間がかかりすぎます。

どうもありがとうございます

score 1 · Accepted Answer

見つけた...

python -c "print (open('filetoconvert.txt','rb').read().decode('unicode-escape').encode('utf-8'))"

score 0 · Accepted Answer

Java JDKがインストールされている場合は、native2asciiUnicodeエスケープとの間でファイルを変換するために呼び出されるユーティリティプログラムがあります。例えば：

native2ascii -reverse filetoconvert.txt > converted.txt

2 に答える 2