Unicode文字を任意の言語からアクセント付きラテン文字に音訳する方法を探しています。その目的は、外国人がラテン文字以外の文字で書かれた名前や単語の発音について洞察を得ることができるようにすることです。
例:
ギリシャ語:Romanize("Αλφαβητικός")
戻り値"Alphabētikós"
(または「Alfavi̱tikós」)
日本語:Romanize("しんばし")
返品"shimbashi"
(または「新橋」)
ロシア語:Romanize("яйца Фаберже")
返品"yaytsa Faberzhe"
(または「jajcaFaberže」)
理想的には、CJK、インド語、キリル文字、セム語、ギリシャ語のスクリプトの文字をサポートする必要があります。ユニコードコンソーシアム、米国、EU、または国連のいずれかからのデータを使用して、データ駆動型で拡張可能である必要があります。コードは、.NETまたはJavaで記述されたオープンソースである必要があります。
そのようなライブラリは存在しますか?