Python でアラビア語ライト ステマー パッケージに取り組んでいます
。操作の結果を Unicode からアラビア文字に変換したいと考えています。
私のコード:
import tashaphyne
form tashaphyne import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)
Unicodeではなく「العربية」と表示させたい
Python でアラビア語ライト ステマー パッケージに取り組んでいます
。操作の結果を Unicode からアラビア文字に変換したいと考えています。
私のコード:
import tashaphyne
form tashaphyne import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)
Unicodeではなく「العربية」と表示させたい
次のように、encode() 関数を使用して、Unicode 文字列を他のエンコーディングに変換できます。
text.encode('utf8')
Python 2.7 で可能なエンコーディングのリストを次に示します。
Unicode 文字列の表現は 7 ビット端末でも表示できるようになっているu'\u0627\u0644\u0639\u0631\u0628\u064a\u0629'
ため、"العربية" の代わりに表示されます。repr()
Unicode の代わりに実際のスクリプトを表示するには、print _
への呼び出しの後に実行するか、直接strip_tashkeel()
実行します。print strip_tashkeel(text)