それで、私はプレーンC(ANSI 9899:1999)プロジェクトに取り組んでおり、Unicode、UTF-8、およびそのすべてのジャズをどこから始めればよいかを理解しようとしています。
具体的には、これは言語インタープリタープロジェクトであり、Unicodeを処理する必要がある2つの主要な場所があります。ソースファイルの読み取り(言語は表面上はUnicode識別子などをサポートします)と「文字列」オブジェクトです。
Unicode、UTF-7 / 8/16/32、UCS-2 / 4などに関するすべての明白な基本に精通しています…私は主に、有用でC固有の(つまり、お願いします)を探しています。 C ++またはC#はありません。これは、以前にSOでここに文書化されたすべてです)Unicode対応のものを実装するための「次のステップ」に関するリソース…Cで。
リンク、マンページ、ウィキペディアの記事、サンプルコードは、すべて大歓迎です。また、後で遭遇する人のために、元の質問でそのようなリソースのリストを維持しようとします。
- Unicodeに慣れていない場合は、他のことを検討する前に必ずお読みください。実際のエンコーディングは次のとおりです。http : //www.joelonsoftware.com/articles/Unicode.html
- UTF-8ホームページ:http ://www.utf-8.com/
man 3 iconv
(iconv_open
およびとiconvctl
)- Unicodeの国際コンポーネント( Geoff Reedy経由)
libbasekit
、軽量のUnicode処理ツールが含まれているようです- GlibにはいくつかのUnicode関数があります
- Christophによる基本的なUTF-8検出器機能