これまでのところ、私はこれをまとめました:
\b\S*[^\w\s^'^&]\S*\b
検閲された単語全体をキャッチしようとしています: IE d*mn
or d_mn
but don't want &
or 't
's
're
to match. また、数字のような1.23
ものが一致しないようにする必要があります。
私の目標は、文字の代わりに記号を使用して、罵り言葉を紛らわそうとしている人々を捕まえることです。したがって、アポストロフィなどを除いて、記号を含む単語はすべてキャッチする必要があります。記号は書式設定であり、&
文字ごとに最大 1 つ存在できます。だから'
、&
使用しても大丈夫です。小数を含む数字は悪口ではないため、機能するはずです。s**t
and d_mn
or d.mn
etcのようなものをキャッチする必要があります。
数字の部分で助けが必要です。
試し^\d.\d
てみましnot digit dot digit
たが、うまくいきませんでした。