regex - 文字が重複せず、文字列の長さ内にある単語の正規表現

Question

正規表現を使用する必要があるたびに、正規表現についてすべてを忘れていることに気づきます。

小文字の英数字のみを含み、2 つの英数字を含まず、長さが {10,12} 文字以内のすべての単語を一致させようとしています。

さて、文字の後に同じ文字が続くかどうかを調べるには、(.)\1. 単語が 10 ～ 12 文字以内かどうかを確認するには、{10,12}. 小文字と数字だけを取得するには、[0-9a-z].

しかし、どうすればそれらをリンクできますか?

乾杯！

PS: これはかなり大きな NLP xml (100 mb 以上) で実行されるため、正規表現が最も遅い代替手段ではない場合に感謝します。

score 3 · Accepted Answer

私はこれがあなたが望むことをすると思います： -

/\b(?:([a-z0-9])(?!\1)){10,12}\b/

説明： -

\b   // Word boundary
(?:
    ([a-z0-9])  // Match lowercase letters or digit
    (?!\1)      // Not followed by the same digit as before
){10,12}        // 10 to 12 times.
\b   // Word boundary

score 2 · Accepted Answer

これが1つですが、より良い方法がないかどうかはわかりません...

/\b(?:([a-z0-9])(?!\1)){10,12}\b/

score 1 · Accepted Answer

これが私の試みです：

 (\b(?![0-9a-z]*([0-9a-z])\2)[0-9a-z]{10,12}\b)

(先読みを使用する必要があり、適切に機能するためには通常、ある種の境界が非常に重要です。したがって\b)。

執筆時点では、別の回答に誤検知があり、eoeuaoarounn

regex - 文字が重複せず、文字列の長さ内にある単語の正規表現

3 に答える 3

Related

Reference