例証する正規表現
ウェブサイトのURL)[a-zA-z]+://[^\s]*
IPアドレス(IPアドレス)((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5] |[01]?\d\d?)
電子メールアドレス\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
QQ番号[1-9]\d{4,}
HTML マークアップ (コンテンツまたは自己終了を含む)<(.*)(.*)>.*<\/\1>|<(.*) \/>
パスワード(数字/大文字/小文字/句読点で構成され、4種類すべてが存在する必要があり、8文字以上)(?=^.{8,}$)(?=.*\d)(?=.*\W+)(?=.*[AZ])(?=.*[az])(?!.* \n).*$
日付(年月日)(\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[ 01])|(0?[1-9]))
日付 (MM/DD/YYYY)((1[0-2])|(0?[1-9]))/((([12][0-9])|(3[01])|(0?[1-9])) /(\d{4}|\d{2})
時間 (時:分、24 時間形式)((1|0?)[0-9]|2[0-3]):([0-5][0-9])
漢字(文字)[\u4e00-\u9fa5]
中国語と全角句読点(文字)[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
中国本土の固定電話番号(\d{4}-|\d{3}-)?(\d{8}|\d{7})
中国本土の携帯電話番号1\d{10}
中国本土の郵便番号[1-9]\d{5}
中国本土 ID 番号 (15 桁または 18 桁)\d{15}(\d\d[0-9xX])?
非負の整数 (正の整数またはゼロ)\d+
正の整数[0-9]*[1-9][0-9]*
負の整数-[0-9]*[1-9][0-9]*
整数-?\d+
小数(-?\d+)(\.\d+)?
abcを含まない単語\b((?!abc)\w)+\b
例証する正規表現
ユーザー名/^[a-z0-9_-]{3,16}$/
パスワード/^[a-z0-9_-]{6,18}$/
16 進値/^#?([a-f0-9]{6}|[a-f0-9]{3})$/
Eメール/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([az\.]{2,6})$/
URL/^(https?:\/\/)?([\da-z\.-]+)\.([az\.]{2,6})([\/\w \.-]*) *\/?$/
IPアドレス/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}( ?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/
HTML タグ/^<([az]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$/
Unicode エンコーディングでの漢字の範囲/^[u4e00-u9fa5],{0,}$/
漢字にマッチする正規表現[\u4e00-\u9fa5]
コメント: 中国語のマッチングは本当に頭が痛いです。この表現を使えば簡単です。
2 バイト文字 (漢字を含む) に一致[^\x00-\xff]
コメント: 文字列の長さを計算するために使用できます (2 バイト文字は 2 としてカウントされ、ASCII 文字は 1 としてカウントされます)。
空白行に一致する正規表現\n\s*\r
コメント: 空白行を削除するために使用できます
HTML タグに一致する正規表現<(\S*?)[^>]*>.*?</\1>|<.*?/>
コメント: インターネット上で出回っているバージョンはあまりにもひどいです. 上記のものはその一部にしか一致せず, 複雑なネストされたタグにはまだ無力です.
先頭および末尾の空白文字に一致する正規表現^\s*|\s*$
コメント: 行頭と行末の空白文字 (スペース、タブ、フォーム フィードなどを含む) を削除するために使用でき、非常に便利な式です。
メールアドレスに一致する正規表現\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
コメント: フォームの検証に役立ちます
URL URL に一致する正規表現[a-zA-z]+://[^\s]*
コメント: インターネット上で流通しているバージョンは機能が非常に限定されており、上記のもので基本的にニーズを満たすことができます
一致するアカウントが合法かどうか (文字で始まり、5 ~ 16 バイトが許可され、英数字のアンダースコアが許可されます)^[a-zA-Z][a-zA-Z0-9_]{4,15}$
コメント: フォームの検証に役立ちます
国内の電話番号を一致させる\d{3}-\d{8}|\d{4}-\d{7}
コメント: 0511-4405222 または 021-87888822 などの一致するフォーム
Tencent QQ番号と一致[1-9][0-9]{4,}
解説: Tencent QQ 番号は 10000 から始まります
中国本土の郵便番号に合わせる[1-9]\d{5}(?!\d)
コメント: 中国本土の郵便番号は 6 桁です
マッチID\d{15}|\d{18}
コメント: 中国本土の ID カードは 15 桁または 18 桁です。
一致する IP アドレス\d+\.\d+\.\d+\.\d+
コメント: IP アドレスを抽出するときに役立ちます
特定の番号に一致する:
^[1-9]\d*$// 正の整数に一致
^-[1-9]\d*$// 負の整数に一致
^-?[1-9]\d*$// 整数に一致
^[1-9]\d*|0$// 非負の整数 (正の整数 + 0) に一致
^-[1-9]\d*|0$//正でない整数に一致 (負の整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$// 正の浮動小数点数に一致
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$// 負の浮動小数点数に一致
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$// 浮動小数点数に一致
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$//非負の浮動小数点数に一致 (正の浮動小数点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$//非正の浮動小数点数に一致 (負の浮動小数点数 + 0)
コメント: 大量のデータを扱う場合に便利、特定のアプリケーションでの修正に注意
特定の文字列に一致
^[A-Za-z]+$//英字26文字からなる文字列にマッチ
^[AZ]+$//英大文字26文字からなる文字列にマッチ
^[az]+$//英小文字26文字からなる文字列にマッチ
^[A-Za-z0-9]+$//数字と 26 文字の英字からなる文字列に一致
^\w+$//数字、26 文字の英字、またはアンダースコアで構成される文字列に一致します
キャラクター説明
\次の文字を特殊文字、リテラル文字、後方参照、または 8 進エスケープとしてマークします。たとえば、「n」は文字「n」と一致します。「\n」は改行文字に一致します。シーケンス "\\" は "\" に一致し、"\(" は "(" に一致します。
^入力文字列の先頭に一致します。RegExp オブジェクトの Multiline プロパティが設定されている場合、^ は "\n" または "\r" の後の位置にも一致します。
$入力文字列の末尾に一致します。RegExp オブジェクトの Multiline プロパティが設定されている場合、$ は "\n" または "\r" の前の位置にも一致します。
*直前の部分式に 0 回以上一致します。たとえば、zo* は「z」だけでなく「zoo」にも一致します。* {0,} に相当します。
+直前の部分式に 1 回以上一致します。たとえば、「zo+」は「zo」と「zoo」に一致しますが、「z」には一致しません。+ は {1,} と同等です。
?直前の部分式と 0 回または 1 回一致します。たとえば、「do(es)?」は、「do」または「dos」の「do」に一致します。? は {0,1} と同等です。
{n}n は負でない整数です。マッチ判定はn回。たとえば、「o{2}」は「Bob」の「o」には一致しませんが、「food」の両方の o には一致します。
{n,}n は負でない整数です。少なくとも n 回一致します。たとえば、「o{2,}」は「Bob」の「o」には一致しませんが、「fooooood」のすべての o には一致します。「o{1,}」は「o+」と同等です。「o{0,}」は「o*」と同等です。
{n,m}m と n はどちらも非負の整数で、n<=m です。少なくとも n 回、最大で m 回一致します。たとえば、「o{1,3}」は「fooooood」の最初の 3 つの o に一致します。「o{0,1}」は「o?」と同等です。コンマと 2 つの数字の間にスペースを入れないでください。
?この文字が他の修飾子 (*、+、?、{n}、{n,}、{n,m}) のいずれかの直後にある場合、マッチング パターンは貪欲ではありません。非貪欲モードは検索文字列に可能な限り一致しませんが、デフォルトの貪欲モードは検索文字列に可能な限り一致します。たとえば、文字列「oooo」の場合、「o+?」は単一の「o」に一致し、「o+」はすべての「o」に一致します。
."\n" を除く任意の 1 文字に一致します。"\n" を含む任意の文字に一致させるには、"[.\n]" のようなパターンを使用します。
(パターン)パターンに一致し、この一致を取得します。取得した一致は、VBScript では SubMatches コレクションを使用し、JScript では $0...$9 プロパティを使用して、生成された Matches コレクションから取得できます。括弧文字を一致させるには、「\(」または「\)」を使用します。
(?: パターン)パターンに一致しますが、一致する結果を取得しません。つまり、取得しない一致であり、後で使用するために保存されません。これは、または文字「(|)」を使用してパターンの一部を結合する場合に便利です。たとえば、「industr(?:y|ies)」は「industry|industries」よりも短い表現です。
(?=パターン)前方参照。パターンに一致する任意の文字列の先頭にある検索文字列に一致します。これは非取得一致です。つまり、後で使用するために一致を取得する必要はありません。たとえば、「Windows(?=95|98|NT|2000)」は「Windows2000」の「Windows」に一致しますが、「Windows3.1」の「Windows」には一致しません。先読みは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、先読みを含む文字の後ではなく、最後の一致の直後に開始されます。
(?! パターン)否定先読みは、パターンに一致しない文字列の先頭にある検索文字列に一致します。これは非取得一致です。つまり、後で使用するために一致を取得する必要はありません。たとえば、「Windows(?!95|98|NT|2000)」は、「Windows3.1」では「Windows」と一致しますが、「Windows2000」では「Windows」と一致しません。先読みは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、先読みを含む文字の後ではなく、最後の一致の直後に開始されます。
x|yx または y に一致します。たとえば、「z|food」は「z」または「food」のいずれかに一致します。"(z|f)ood" は、"zood" または "food" に一致します。
[xyz]キャラ集合。含まれる文字のいずれかに一致します。たとえば、「[abc]」は「plain」の「a」と一致します。
[^xyz]負の文字セット。含まれていない任意の文字に一致します。たとえば、「[^abc]」は「plain」の「p」に一致します。
[az]文字の範囲。指定された範囲内の任意の文字に一致します。たとえば、"[az]" は、"a" から "z" までの範囲の小文字のアルファベットに一致します。
[^az]負の文字範囲。指定された範囲外の任意の文字に一致します。たとえば、"[^az]" は、"a" から "z" までの範囲にない任意の文字に一致します。
\b単語境界、つまり単語とスペースの間の位置に一致します。たとえば、"er\b" は "never" の "er" に一致しますが、"verb" の "er" には一致しません。
\B単語以外の境界に一致します。"er\B" は "verb" の "er" に一致しますが、"never" の "er" には一致しません。
\cxx で示される制御文字に一致します。たとえば、\cM は Control-M またはキャリッジ リターンに一致します。x の値は、AZ または az のいずれかでなければなりません。それ以外の場合は、c をリテラル "c" 文字として扱います。
\d数字に一致します。[0-9] に相当します。
\D数字以外の文字に一致します。[^0-9] に相当します。
\fフォーム フィード文字に一致します。\x0c および \cL と同等です。
\n改行文字に一致します。\x0a および \cJ と同等です。
\rキャリッジ リターンに一致します。\x0d および \cM に相当します。
\sスペース、タブ、フォーム フィードなど、あらゆる空白文字に一致します。[\f\n\r\t\v] と同等。
\S空白以外の任意の文字に一致します。[^\f\n\r\t\v] と同等。
\tタブ文字に一致します。\x09 および \cI と同等です。
\v垂直タブ文字に一致します。\x0b および \cK と同等です。
\wアンダースコアを含む任意の単語文字に一致します。「[A-Za-z0-9_]」に相当。
\W単語以外の任意の文字に一致します。「[^A-Za-z0-9_]」と同等。
\xnn に一致します。ここで、n は 16 進数のエスケープ値です。16 進エスケープ値は、特定の 2 桁の長さでなければなりません。たとえば、「\x41」は「A」に一致します。「\x041」は「\x04&1」と同等です。ASCII エンコーディングは、正規表現で使用できます。.
\numnum に一致します。num は正の整数です。フェッチされたヒットへの参照。たとえば、「(.)\1」は 2 つの連続する同一文字に一致します。
\n8 進エスケープ値または後方参照を識別します。\n の前に少なくとも n 個のフェッチされた部分式がある場合、n は後方参照です。それ以外の場合、n が 8 進数 (0 から 7) の場合、n は 8 進数のエスケープ値です。
\nm8 進エスケープ値または後方参照を識別します。nm は、\nm の前に取得された部分式が少なくとも nm ある場合、後方参照です。\nm の前に少なくとも n 回のフェッチがある場合、n は後方参照であり、その後にリテラル m が続きます。上記の条件のいずれも満たされない場合、n と m の両方が 8 進数 (0 から 7) であれば、\nm は 8 進数のエスケープ値 nm と一致します。
\nmln が 8 進数 (0 から 3) で、m と l の両方が 8 進数 (0 から 7) の場合、8 進数のエスケープ値 nml に一致します。
\国連n に一致します。n は 4 桁の 16 進数で表される Unicode 文字です。たとえば、\u00A9 は著作権記号 (?) に一致します。