3

Python でアラビア語ライト ステマー パッケージに取り組んでいます
。操作の結果を Unicode からアラビア文字に変換したいと考えています。

私のコード:

import tashaphyne
form tashaphyne  import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)

Unicodeではなく「العربية」と表示させたい

4

2 に答える 2

1

次のように、encode() 関数を使用して、Unicode 文字列を他のエンコーディングに変換できます。

text.encode('utf8')

Python 2.7 で可能なエンコーディングのリストを次に示します。

于 2013-02-12T20:19:38.233 に答える
0

Unicode 文字列の表現は 7 ビット端末でも表示できるようになっているu'\u0627\u0644\u0639\u0631\u0628\u064a\u0629'ため、"العربية" の代わりに表示されます。repr()

Unicode の代わりに実際のスクリプトを表示するには、print _への呼び出しの後に実行するか、直接strip_tashkeel()実行します。print strip_tashkeel(text)

于 2013-02-12T20:35:30.357 に答える