Basic Multilingual Plane の文字については、'\uxxxx' を使用してエスケープできます。たとえば、/[\u4e00-\u9fff]/ を使用して一般的な漢字に一致させることができます (0x4e00-0x9fff は CJK Unified Ideographs の範囲です)。
ただし、Basic Multilingual Plane 以外の文字の場合、コードは 0xffff よりも大きくなります。'\u20000' は、コードが 0x20000 である文字ではなく、文字 '\u2000' と文字 '0' を意味するため、フォーマット '\uxxxx' を使用してエスケープすることはできません。
Basic Multilingual Plane から文字をエスケープするにはどうすればよいですか? これらの文字はほとんどのフォントで表示できないため、直接使用することはお勧めできません。