1

私はまだアムハラ語 (Geez / Ethiopic) の文字を読むのが苦手です。

Ge'ez (エチオピア) 文字 ( http://en.wikipedia.org/wiki/Ge%27ez_language )のテキストがある場合、それらを ASCII に音訳したいと思います。

LYNX Textmode ブラウザーでhttp://www.addismap.com/am/ (アムハラ語の Web ページ) にアクセスすると、「edis map: yeedis ebeba karta」と表示されます。Python、Bash、PHP などでこの機能にアクセスするにはどうすればよいですか? 彼らはどの API を使用していますか?

それはiconvではないようです:

$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input:    ሀ ለ ሐ መ ሠ ረ ሰ
Output:   ? ? ? ? ? ? ?
4

2 に答える 2

2

ICU http://icu-project.org/には、テキストを「hāleḥāmešerese」に変換するアムハラ語-ラテン語変換があります。これuconv -x 'Amharic/BGN-Latin'は、コマンドラインから使用するか、pyicuを使用して使用できます。

于 2010-10-16T00:10:09.220 に答える
0

Unicode Common Locale Data Repositoryでは、いくつかの音訳が定義されています。 Unidecode (またはそのPython ポート) には、さらに多くのものがあります。

于 2010-09-10T13:28:15.753 に答える