このテーマに関する他の質問を見ましたが、それらすべてに重要な詳細がありませんでし\u00252F\u00252F\u05de\u05e8\u05db\u05d6
た。utf8に変換したいと思います。ストリームを調べて、\ uに続いて、バイトに変換する4つの16進数を探していることを理解しています。問題は次のとおりです。
- 4バイト後、6バイト後を探すこともあると聞きましたが、これは正しいですか?もしそうなら、それをどのように判断しますか?たとえば、
\u00252F
4バイトまたは6バイトですか? \u0025
これが2バイト(0x25)ではなく1バイトにマップされる場合、なぜですか?4つの16進数は、utf8に変換することになっているutf16を表すことになっていますか?- テキストがリテラル文字である
\u0025
かUnicodeシーケンスであるかを知るにはどうすればよいですか?これは、すべての円記号をストリームでエスケープする必要があることを意味しますか? - 最後に、iconvを使用してこれを実行できるのに、手作業でこれを実行するのは愚かですか?