1

アラビア語では、各文字には周囲の文字に基づいた 4 つの表現があります。詳細については、アラビア文字、UnicodeおよびUnicode 6.2.0 のアラビア語、第 8 章を参照してください。

アルゴリズムの実装、またはアラビア語のコードポイントの配列を指定して、テキストのレンダリングに使用される表現形式 (分離、中間など) を計算できる OS ライブラリを探しています。

テキスト自体をレンダリングするつもりはないので、java.awt.font のような低レベルのライブラリは役に立ちません。ICU4J も使用してみましたが、情報を抽出する方法がわかりません。

独自のソリューションを実装する前に何かアイデアはありますか?

4

2 に答える 2

1

うまくいく可能性のある回避策を見つけました。ICU4J と ArabicShapping クラスを使用して、コードポイントを 06XX コードブロックから FEXX コードブロックに変換できます。FEXX コードブロックには、フォームに関する情報が含まれています。少し無理が​​あるので、Unicode 標準で定義されている結合アルゴリズムを実装したほうがよいかもしれません。

于 2013-02-06T21:33:36.570 に答える
0

通常、アラビア語のテキストをレンダリングする場合、実際には Unicode コードポイントを変更しません。各文字を選択したフォントのグリフにマップし、OpenType 置換機能を適用して各グリフを目的の形式に変更するだけです。関連する OpenType 機能は、「medi」、「init」、「fina」、および「isol」です。

しかし、プラットフォームのフォント レンダリングがこれを処理するはずですが、実際に何をしようとしているのでしょうか?

于 2013-02-06T23:33:37.803 に答える