UTF-8 文字で構成される入力をトークン化しようとしています。一部の人がutf8の学習を試みている間、理解できない出力が得られます。characher π (pi) を入力すると、3 つの異なる数字 207 128 10 が得られます。それらを使用して、どのカテゴリに属するかを制御するにはどうすればよいですか?
ostringstream oss;
oss << cin.rdbuf();
string input = oss.str();
for(int i=0; i<input.size(); i++)
{
unsigned char code_unit = input[i];
cout << (int)code_unit << endl;
}
前もって感謝します。