-1

UTF-8エンコーディングとは?私はそれをグーグルで検索しましたが、それが何であるかを理解できませんでした。簡単な言葉と例で説明してください。

次に、エンコーディングで 1 つの文字列をエンコードする必要がありUTF-8ます。取得しましたが、フォーマットopensslのみで変換していbase64ます。

#include<stdio.h>

struct some
{
    char string[40];
};

int main() 
{
    string *s;
    char str[9];
    gets(str);
    strcpy(s,str);
    /*Now how to get emcoded form of "Hello" in UTF-8*/
    /*printf("encoded data");
    return 0;
}

これらの文字列は で入手できるruntimeので、今後の予定については何もしないでください。エンコード後、それらを に保存する必要がありますDB

私はそれ自体をチェックしましたが、 でSOソースを見つけることができませんでしc.net java c#。を使用してlinux Redhatいます。

4

1 に答える 1

2

エンコーディングは、どのバイトまたは一連のバイトがどの文字に対応するかを記述します。ASCII は最も単純なエンコーディングです。ASCII では、1 バイト値が 1 文字に対応します。残念ながら、世界には 255 を超えるキャラクターが存在します。UTF-8 は、英語の ASCII と互換性があるため、おそらく最も一般的なエンコード形式ですが、国際文字も使用できます。標準的な英語の文字列を C で書くと、すでに UTF-8 になっています。「こんにちは」==「こんにちは」

Joel は、この主題について次のような素晴らしい記事を書いています: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

ASCII、Unicode、および UTF8 文字列エンコーディングについて説明しています。

UTF-8 では、0 ~ 127 のすべてのコード ポイントが 1 バイトに格納されます。128 以上のコード ポイントのみが、2、3、実際には最大 4 (6 ではなく、R. により修正) バイトを使用して格納されます。

于 2013-08-27T19:42:07.570 に答える