2

場所の名前の文字列を「インテリジェントに」ASCIIに変換しようとしています。私が探しているのは音訳だと思います。'uconv' utilを使用して、いくつかの有望な結果を得ることができました。

私の入力が「エンベラ」だったとしましょう。

uconv -x Latin-ASCII input.dat > output.dat

対応する出力は「エンベラ」になります-まさに私が欲しいものです。ただし、場合によっては、期待した結果が得られないことがあります(入力が最初からラテン語でない場合など)。たとえば、この場所を確認してください(名前をこのテキストボックスに正しくコピーして貼り付けることはできません)http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1 、+マケドニア+(FYROM)&t = m&z=12

理想的にはそれは「Karpos」に音訳されます(私は思います)が、上記のコマンドでuconvの入力として使用すると、uconvはそれをまったく変更しません。

それで、地名のリスト(誰かが興味を持っているならここにリストがあります-http ://www.mediafire.com/file/gb0guu117yp1p26/test.dat)を与えられて、どうすればそれらをASCIIに変換できますか?

4

1 に答える 1

3

試してください また 、出力内のすべてを ascii に強制的に-x 'Any-Latin;Latin-ASCII' 追加することもできます。--to-callback escape-unicode -t ascii{U+3045}

「インテリジェントに」は...ここでは相対的であることに注意してください。あなたは多くの情報を取り除き、何層もの翻訳を経ています。これはあまり役に立ちません-x 'el-en;Any-Latin;Latin-ASCII'が、テキストがギリシャ語から英語 (el-en) に移動していることがわかっている場合は、言語固有の音訳を使用しようとすることができます。

于 2012-09-27T20:51:28.323 に答える