これまでのところ、私はこれをまとめました:
\b\S*[^\w\s^'^&]\S*\b
検閲された単語全体をキャッチしようとしています: IE d*mnor d_mnbut don't want &or 't 's 'reto match. また、数字のような1.23ものが一致しないようにする必要があります。
私の目標は、文字の代わりに記号を使用して、罵り言葉を紛らわそうとしている人々を捕まえることです。したがって、アポストロフィなどを除いて、記号を含む単語はすべてキャッチする必要があります。記号は書式設定であり、&文字ごとに最大 1 つ存在できます。だから'、&使用しても大丈夫です。小数を含む数字は悪口ではないため、機能するはずです。s**tand d_mnor d.mnetcのようなものをキャッチする必要があります。
数字の部分で助けが必要です。
試し^\d.\dてみましnot digit dot digitたが、うまくいきませんでした。