Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
UTF-8 でエンコードされたテキスト ファイルがあります。文字で読めます。各文字は、1 バイトまたはマルチバイトのいずれかです。1 バイトが読み取られた場所と、1 バイト以上読み取られた場所を知るにはどうすればよいですか?
sの読み取り中にバイトをカウントしますchar。
char
それぞれについてchar c:
char c
if(c<128) bytesCount++; else if (c<2048) bytesCount+=2; else bytesCount+=3;
定義のエンコードウィキペディアURF8も参照してください。