私は簡単なファイル パーサーとライターを書きましたが、Unicode の重要性について話している記事に出くわし、入力ファイルが ASCII でエンコードされていると仮定していることに気付きました。私の状況ではまれですが。
これらのまれなケースでは、UTF-8 でエンコードされたファイルが必要です。
読み書きの方法を変更するだけで UTF-8 ファイルを操作する方法はありますか? 文字列に対して行うことは、それらを保存してから書き出すことだけなので、適切に読み取り、保存、書き込みできることを確認するだけで済みます。
さらに、ascii ファイルと UTF-8 ファイルを別々に扱い、それぞれに異なる関数を作成する必要がありますか? 私はまだASCIIファイル以外を扱ったことがなく、Unicodeの処理について読んだだけです。