キリル文字の utf-8 文字列を音訳しようとすると、
Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s
(質問/1726404/transliteration-in-ruby を参照)
文字変換が必要な記号以外はすべて取得しています。
例: 'r-строка' → 'r-' および 'Gévry' → 'Gvry'。
どうしたの?
Ruby 1.8.7 / Rails 2.3.5 / WSeven
キリル文字の utf-8 文字列を音訳しようとすると、
Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s
(質問/1726404/transliteration-in-ruby を参照)
文字変換が必要な記号以外はすべて取得しています。
例: 'r-строка' → 'r-' および 'Gévry' → 'Gvry'。
どうしたの?
Ruby 1.8.7 / Rails 2.3.5 / WSeven
require 'iconv'
p Iconv.iconv('ascii//translit//ignore', 'utf-8', 'Gévry') #=> ["Gevry"]
# not 'ascii//ignore//translit'
キリル文字の場合、音訳された宝石が機能する可能性があります。
もう 1 つの方法は、iconv を使用せずに String の tr および gsub メソッドによってカスタム トランスライトを作成することです。
# encoding: UTF-8
def russian_translit(text)
translited = text.tr('абвгдеёзийклмнопрстуфхэыь', 'abvgdeezijklmnoprstufhey\'')
translited = translited.tr('АБВГДЕЁЗИЙКЛМНОПРСТУФХЭ', 'ABVGDEEZIJKLMNOPRSTUFHEY\'')
translited = translited.gsub(/[жцчшщъюяЖЦЧШЩЪЮЯ]/,
'ж' => 'zh', 'ц' => 'ts', 'ч' => 'ch', 'ш' => 'sh', 'щ' => 'sch', 'ъ' => '', 'ю' => 'ju', 'я' => 'ja',
'Ж' => 'ZH', 'Ц' => 'TS', 'Ч' => 'CH', 'Ш' => 'SH', 'Щ' => 'SCH', 'Ъ' => '', 'Ю' => 'JU', 'Я' => 'JA')
return translited
end
p russian_translit("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!")
#=> "V chaschah juga zhil by tsitrus? Da, no fal'shivyj ekzempljar!"