8が有効なPCREであり、\p{Po}グループと他の多くのものを一致させようとしています。
アンパサンド文字を除外したい。特定のキャラクターをクラスから除外するにはどうすればよいですか?
-- lua btw
local utf8_general_punctuation_reg = "[\\p{Po}\\p{Cc}\\p{Cs}\\p{Pc}\\p{Pe}\\p{Ps}\\p{Pf}\\p{Pi}\\p{Sm}\\x{2100}-\\x{2123}\\x{2600}-\\x{26ff}]+"
前もって感謝します!
ところで、\p{Po}はutf8用ですhttp://www.fileformat.info/info/unicode/category/Po/list.htm
以下の答えからうまくいくものを追加するだけです:
local utf8_general_punctuation_reg = "[\\p{Po}\\p{Cc}\\p{Cs}\\p{Pc}\\p{Pe}\\p{Ps}\\p{Pf}\\p{Pi}\\p{Sm}\\x{2100}-\\x{2123}\\x{2600}-\\x{26ff}]+(?<!(&|\\.|:))"