2

文字 [az] および [0-9] への Unicode 文字の双方向マッピングを作成したいと考えています。{の左中かっこのような Unicode 文字名を使用することを考えました。残念ながら、すべての UTF-8 文字のリストを見つけることができませんでした。それらの文字の説明は、Ruby 内でアクセスできるように既に準備されています。ウィキペディアには Unicode 文字のリストが含まれており、Unicode コンソーシアムによる Unicode 名リストがあります。リストのパーサーを書き始める前に、次の質問をしたいと思いました。

  • Ruby で UTF-8 文字名にアクセスするための既存のソリューション / gem は既にありますか?
  • UTF-8 文字名を使用して任意の UTF-8 文字列を変換する最も効率的な方法は何でしょうか?
4

3 に答える 3

2

unicode utils gemを試すことができます

require "unicode_utils/char_name"
UnicodeUtils.char_name "ᾀ" => "GREEK SMALL LETTER ALPHA .."

代替案については、「unicode ..」の Ruby ツールボックスを参照してください。

Unicode gemも有望に見えます

Unicode::decompose(str)
于 2013-05-20T10:31:07.050 に答える