この正規表現は、ASCII以外のすべての文字、0〜128のコードポイントに一致することになっています。
/[^x00-x7F]/i
この正規表現をすべてのUnicode文字、0-1114111コードポイントでテストしたいとします(好奇心から)。
この範囲の生成は、おそらく簡単range(0, 1114111)
です。次に、関数を使用して各10進数を16進数に変換する必要がありdechex()
ます。
その後、16進数を実際の文字に変換するにはどうすればよいですか?また、ASCIIスキームにすでに含まれている文字をどのように除外できますか?