場所の名前の文字列を「インテリジェントに」ASCIIに変換しようとしています。私が探しているのは音訳だと思います。'uconv' utilを使用して、いくつかの有望な結果を得ることができました。
私の入力が「エンベラ」だったとしましょう。
uconv -x Latin-ASCII input.dat > output.dat
対応する出力は「エンベラ」になります-まさに私が欲しいものです。ただし、場合によっては、期待した結果が得られないことがあります(入力が最初からラテン語でない場合など)。たとえば、この場所を確認してください(名前をこのテキストボックスに正しくコピーして貼り付けることはできません)http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1 、+マケドニア+(FYROM)&t = m&z=12。
理想的にはそれは「Karpos」に音訳されます(私は思います)が、上記のコマンドでuconvの入力として使用すると、uconvはそれをまったく変更しません。
それで、地名のリスト(誰かが興味を持っているならここにリストがあります-http ://www.mediafire.com/file/gb0guu117yp1p26/test.dat)を与えられて、どうすればそれらをASCIIに変換できますか?