「Dビ」のような文字列があり、その正しい Unicode 文字を取得したいと考えています。現在、私は str.charCodeAt(index) を使用してユニコード文字を取得していますが、アラビア文字の場合は 0600 から 06FF の間になります。ただし、アラビア語のプレゼンテーションフォームAとBが必要です-実際に書かれている方。
誰でもこれを行う方法を提案できますか?
「Dビ」のような文字列があり、その正しい Unicode 文字を取得したいと考えています。現在、私は str.charCodeAt(index) を使用してユニコード文字を取得していますが、アラビア文字の場合は 0600 から 06FF の間になります。ただし、アラビア語のプレゼンテーションフォームAとBが必要です-実際に書かれている方。
誰でもこれを行う方法を提案できますか?
あなたが投稿した文字列は、0600...06FF の範囲の 3 つの通常のアラビア文字で構成されているため、取得しているのは正しい Unicode 文字です。使用されているコンテキスト グリフ フォームを決定したい場合、それは文字レベルの外にあり、文字列から決定することはできません。(アラビア語の書き方の規則を適用することで、どの形式を使用するかを決定できますが、それは、レンダリング ソフトウェアで実際に使用される形式を知ることとは異なります。)
アラビア語表示形式は、通常の使用を意図していない従来の文字です。通常のレンダリングは、通常の文字をそのような形式に変換することではなく、文脈に応じてグリフを選択することを想定しています。