奇妙なウクライナ語Кири́ллに出会いました。それを Unicode に変換し、False を返した isalpha でテストしました。調べてみると、この単語には「結合鋭アクセント」という名前の文字が含まれていることがわかりました。したがって、文字и́は、実際にはиと́ の 2 つの文字の組み合わせです。 私の理解が正しければ、記号の組み合わせ (この鋭いアクセントのような) は、他の文字を変更することのみを目的としています。したがって、isalpha はこの文字列を単語として認識する必要があります。私が間違っている?正しい結果を得る方法はありますか?utf8 で問題の単語:
単語 = '\xd0\x9a\xd0\xb8\xd1\x80\xd0\xb8\xcc\x81\xd0\xbb\xd0\xbb'