UTF-8 bytearray を想定して、任意の個々のバイトが a-zA-Z の文字範囲にあるかどうかを確認する方法は、これらの文字が 1 バイトで表されていることを知っていますか? これらの文字はASCIIアルファベット文字の整数値に対応し、UTF-8では1バイトであり、マルチバイト文字の個々のバイトはこれらの文字のいずれかの整数値と決して一致しないため、バイトの整数値をチェックするのが最も速いようです.そして最も安全です。
これは私にとってはうまくいきますが、最も効率的ですか?
def isAsciiAlphaByte(c):
return ((c>96 and c<123) or (c> 64 and c<91))
isAsciiAlphaByte(b"abc"[0])
>>> True