0

このウルドゥー語の行をラテン語に変換してから、ラテン文字を (アクセントを削除するなどして) ASCII に変換しようとしていますが、一部の文字が欠落しているようです。

非ラテン文字 (「ہ」、「ے」など) がまだ存在するのはなぜですか?

$ uconv -x 'Any-Latin'
دفعہ 1: تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوۓ ہیں۔ انہیں ضمیر اور عقل ودیعت ہوئی ہے۔ اس لئے انہیں ایک دوسرے کے ساتھ بھائی چارے کا سلوک کرنا چاہئے

dfʿہ 1: tmạm ạnsạn ậzạd ạwr ḥqwq w ʿzt ḵے ạʿtbạr sے brạbr py̰dạ ہwے̉ ہy̰ں۔ ạnہy̰ں ḍmy̰r ạwr ʿql wdy̰ʿt ہwỷy̰ ہے۔ ạs lỷے ạnہy̰ں ạy̰ḵ dwsrے ḵے sạtھ bھạỷy̰ cẖạrے ḵạ slwḵ ḵrnạ cẖạہỷے

Any-ASCIIトランスリテレータが ASCII に変換しないのはなぜですか?

$ uconv -x 'Any-Latin; Latin-ASCII'
دفعہ 1: تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوۓ ہیں۔ انہیں ضمیر اور عقل ودیعت ہوئی ہے۔ اس لئے انہیں ایک دوسرے کے ساتھ بھائی چارے کا سلوک کرنا چاہئے

dfʿہ 1: tmam ansan azad awr hqwq w ʿzt kے aʿtbar sے brabr pyda ہwے̉ ہyں۔ anہyں dmyr awr ʿql wdyʿt ہwyy ہے۔ as lyے anہyں ayk dwsrے kے satھ bھayy charے ka slwk krna chaہyے
$ uconv -x 'Any-Latin; Latin-ASCII' -t latin1
دفعہ 1: تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوۓ ہیں۔ انہیں ضمیر اور عقل ودیعت ہوئی ہے۔ اس لئے انہیں ایک دوسرے کے ساتھ بھائی چارے کا سلوک کرنا چاہئے

Conversion from Unicode to codepage failed at output byte position 2. Unicode: 02bf Error: Invalid character found
4

1 に答える 1

0

このコマンドを使用すると、これらの文字が何であるかを確認できます。

uconv -x 'Any-Latin; Latin-ASCII' --to-callback escape-c -t ascii

  • -t ascii :出力を実際のASCIIに変換します。latin1だけではありません。
  • --to-callback escape-c:変換できなかったものはすべて、「エスケープ」コールバックを通過します

これにより、次の結果が得られます。

df\u02BF\u06C1 1: tmam ansan azad awr hqwq w \u02BFzt k\u06D2 a\u02BFtbar s\u06D2 brabr pyda \u06C1w\u06D2\u0309 \u06C1y\u06BA\u06D4 an\u06C1y\u06BA dmyr awr \u02BFql wdy\u02BFt \u06C1wyy \u06C1\u06D2\u06D4 as ly\u06D2 an\u06C1y\u06BA ayk dwsr\u06D2 k\u06D2 sat\u06BE b\u06BEayy char\u06D2 ka slwk krna cha\u06C1y\u06D2

したがって、U+06C1 HEH GOALたとえば音訳されません。CLDRチケットを提出できます。

実際には、すでにこれがあります:http: //unicode.org/cldr/trac/ticket/4387

ウルドゥー語-ラテン語の音訳があれば、ur-Latinの代わりに使用できますAny-Latin。このようにして、アラビア文字のルールだけでなく、ウルドゥー語固有のルールが使用されます。

もし私があなたなら、チケット4387でフォローアップします。

于 2012-11-13T00:44:06.167 に答える