トルコ語の文字「ÇçĞğİıÖöŞşÜü」は、すべて定義されているように見えますが、utf-8 エンコーディングでは正しく処理されません。それらの文字コードはすべて 65533 (置換文字、おそらくエラー表示用) であり、選択したフォントに応じて疑問符またはボックスが表示されます。場合によっては、0/null が charcode として返されます。インターネット上には、それらの utf-8 定義を提供するツールがたくさんありますが、ツールが定義済みの (実際の/国際的な) レジストリを使用するのか、既知のルールと計算で定義を動的に作成するのかはわかりません。それらのフォントは明確に定義されており、コードポイントを手動で入力しても問題なく表示されます。これは、utf-8 で定義されていることを証明しています。しかし一方で、それらは ajax リクエスト/レスポンスなどのエンコーディングや変換では処理されません。
したがって、基本的な質問は「CHAR のコードポイントを定義するにはどうすればよいか」です。誤解を避けるために、質問は次のように調整することができます。「Ç」のエンコードデータをこのように用意したとします -> キャラクター:Ç キャラクター名:CEDILLA 付きラテン大文字 C 16 進コードポイント:00C7 10 進コードポイント:199 16 進 UTF-8 バイト:C387 ......この情報を標準の utf-8 文字として保存する場所/方法は? どのように配布/公開(他の人が使用できるようにする)できますか? 誰か/財団 (unicode/utf-8 コンソーシアムなど) による確認が必要ですか? エラーが既に登録されているが正しく機能していない場合、エラーを検出/修正するにはどうすればよいですか? custom-utf8 構成を使用できますか? はいの場合、どのように?
注 : 誤用の問題ではないため、ここではコード スニペットは必要ありません。