1

文字が同義語を取得できるライブラリがあるかどうかを知りたいですか?

何かのようなもの:

char c = getNextChar();
if (c == latin.H || c == cyrillic.H) {
    //...
}
4

1 に答える 1

2

したがって、私が理解しているように、文字の「同義語」は必要ありません。同じ「グリフ」(形状)の文字が必要です。

そのようなライブラリが存在するかどうかはわかりません。ただし、お気に入りのフォントを使用して文字をレンダリングし、グリフの「同一性」をチェックすることでそれを行うことができます。

たとえば、次の手順を実行できます。

  • UniFontを、できればBDF 形式でダウンロードします
  • すべての文字のビットマップのチェックサム (MD5 など) を計算する
  • チェックサムに基づいて文字をグループ化します。

上記の手順を実行して小さな Python 2.7 テスト スクリプトを(開発速度の目的で) 作成し、次のようなものを作成しました(抜粋):

Group 0041
        U+0041 LATIN CAPITAL LETTER A
        U+0391 GREEK CAPITAL LETTER ALPHA
        U+13AA CHEROKEE LETTER GO
Group 0042
        U+0042 LATIN CAPITAL LETTER B
        U+0392 GREEK CAPITAL LETTER BETA
        U+0412 CYRILLIC CAPITAL LETTER VE
        U+13F4 CHEROKEE LETTER YV

YMMV。

于 2011-11-21T07:54:18.127 に答える