UTF-8 でエンコードされた Wikipedia XML ダンプを使用しています。現在、すべてを std::string として読み込んでいるため、std::cout を画面に表示すると、外国語の文字がぎくしゃくして表示されます。
ただし、実際の解析プロセスでは ASCII 文字のみが検索されますが、解析されたファイルをディスクに書き込むときに、外国語の文字を保持したいと考えています。つまり、出力のエンコーディングを入力と同じにしたいのです。
std::string を使用しても問題ありませんか、それとも ICU などを使用する必要がありますか? 私が調べたライブラリは、非常に複雑に思えます。これを行うために使用できる簡単なものはありますか?