正規表現を使用する必要があるたびに、正規表現についてすべてを忘れていることに気づきます。
小文字の英数字のみを含み、2 つの英数字を含まず、長さが {10,12} 文字以内のすべての単語を一致させようとしています。
さて、文字の後に同じ文字が続くかどうかを調べるには、(.)\1
. 単語が 10 ~ 12 文字以内かどうかを確認するには、{10,12}
. 小文字と数字だけを取得するには、[0-9a-z]
.
しかし、どうすればそれらをリンクできますか?
乾杯!
PS: これはかなり大きな NLP xml (100 mb 以上) で実行されるため、正規表現が最も遅い代替手段ではない場合に感謝します。