ブーストの regex_search() を使用して html ページから取得した文字列があります。残念ながら、ページ内の日本語の文字は \u コードとして記述されており、これらは regex_search によって文字列内の通常の文字として解釈されます。
それで、私の質問は、これらのコードを通常の Unicode テキストに変換するにはどうすればよいですか? (明らかにUTF-8)
これは、UTF-8 をまったく考慮しない fstream の根本的な問題です。ブーストには fstream の独自の実装があるようですが、それに変更しても私のプログラムには影響がなく、Boost の fstream を UTF-8 で動作するように構成するための追加の設定が見つかりませんでした (ただし、今日は初めて作業を行う日です)。ブーストを使用すると、見逃していた可能性があります)。
最後の注意として、私はこれを Linux で実行していますが、システム固有のソリューションよりもポータブルなソリューションを歓迎します。
みんなありがとう、私は本当に助けに感謝します:D