「Mais、tu n'as pas fait tesdevoirs?!」のような文でいっぱいのテキストファイルがいくつかあります。-\ u00c9l \ u00e8ve:「ベンノン」
すべての発音区別符号をutf8形式で復元する簡単な方法(スクリプトまたはユーティリティ)はありますか?(期待される結果:Élève: "Ben non")
sedを使用して手動で行うこともできますが、テキストファイルには複数の言語に固有の発音区別符号が含まれているため、時間がかかりすぎます。
どうもありがとうございます