よく使われる正規表現

よく使う正規表現 (Regular Expression) を集めて、プログラム開発、よく使う正規表現、すぐに使えて便利、貴重な時間を節約、プログラム開発効率を向上させるために、次の正規表現は何度もテストされ、常に増加しています。、異なるプログラムまたはツールの正規表現はわずかに異なるため、必要に応じて単純に変更して使用できます

例証する	正規表現
ウェブサイトのURL）	[a-zA-z]+://[^\s]*
IPアドレス（IPアドレス）	((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5] \|[01]?\d\d?)
電子メールアドレス	\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*
QQ番号	[1-9]\d{4,}
HTML マークアップ (コンテンツまたは自己終了を含む)	<(.)(.)>.<\/\1>\|<(.) \/>
パスワード（数字/大文字/小文字/句読点で構成され、4種類すべてが存在する必要があり、8文字以上）	(?=^.{8,}$)(?=.\d)(?=.\W+)(?=.[AZ])(?=.[az])(?!.* \n).*$
日付（年月日）	(\d{4}\|\d{2})-((1[0-2])\|(0?[1-9]))-(([12][0-9])\|(3[ 01])\|(0?[1-9]))
日付 (MM/DD/YYYY)	((1[0-2])\|(0?[1-9]))/((([12][0-9])\|(3[01])\|(0?[1-9])) /(\d{4}\|\d{2})
時間 (時:分、24 時間形式)	((1\|0?)[0-9]\|2[0-3]):([0-5][0-9])
漢字（文字）	[\u4e00-\u9fa5]
中国語と全角句読点（文字）	[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
中国本土の固定電話番号	(\d{4}-\|\d{3}-)?(\d{8}\|\d{7})
中国本土の携帯電話番号	1\d{10}
中国本土の郵便番号	[1-9]\d{5}
中国本土 ID 番号 (15 桁または 18 桁)	\d{15}(\d\d[0-9xX])?
非負の整数 (正の整数またはゼロ)	\d+
正の整数	[0-9][1-9][0-9]
負の整数	-[0-9][1-9][0-9]
整数	-?\d+
小数	(-?\d+)(\.\d+)?
abcを含まない単語	\b((?!abc)\w)+\b

正規表現は、実用的で効率的な文字列処理、フォーム検証などで使用されます。いざという時に備えて、よく使われる表現をまとめました。

例証する	正規表現
ユーザー名	/^[a-z0-9_-]{3,16}$/
パスワード	/^[a-z0-9_-]{6,18}$/
16 進値	/^#?([a-f0-9]{6}\|[a-f0-9]{3})$/
Eメール	/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([az\.]{2,6})$/
URL	/^(https?:\/\/)?([\da-z\.-]+)\.([az\.]{2,6})([\/\w \.-]) \/?$/
IPアドレス	/^(?:(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.){3}( ?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)$/
HTML タグ	/^<([az]+)([^<]+)(?:>(.)<\/\1>\|\s+\/>)$/
Unicode エンコーディングでの漢字の範囲	/^[u4e00-u9fa5],{0,}$/
漢字にマッチする正規表現	[\u4e00-\u9fa5]
コメント: 中国語のマッチングは本当に頭が痛いです。この表現を使えば簡単です。
2 バイト文字 (漢字を含む) に一致	[^\x00-\xff]
コメント: 文字列の長さを計算するために使用できます (2 バイト文字は 2 としてカウントされ、ASCII 文字は 1 としてカウントされます)。
空白行に一致する正規表現	\n\s*\r
コメント: 空白行を削除するために使用できます
HTML タグに一致する正規表現	<(\S?)[^>]>.?</\1>\|<.?/>
コメント: インターネット上で出回っているバージョンはあまりにもひどいです. 上記のものはその一部にしか一致せず, 複雑なネストされたタグにはまだ無力です.
先頭および末尾の空白文字に一致する正規表現	^\s\|\s$
コメント: 行頭と行末の空白文字 (スペース、タブ、フォームフィードなどを含む) を削除するために使用でき、非常に便利な式です。
メールアドレスに一致する正規表現	\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*
コメント: フォームの検証に役立ちます
URL URL に一致する正規表現	[a-zA-z]+://[^\s]*
コメント: インターネット上で流通しているバージョンは機能が非常に限定されており、上記のもので基本的にニーズを満たすことができます
一致するアカウントが合法かどうか (文字で始まり、5 ～ 16 バイトが許可され、英数字のアンダースコアが許可されます)	^[a-zA-Z][a-zA-Z0-9_]{4,15}$
コメント: フォームの検証に役立ちます
国内の電話番号を一致させる	\d{3}-\d{8}\|\d{4}-\d{7}
コメント: 0511-4405222 または 021-87888822 などの一致するフォーム
Tencent QQ番号と一致	[1-9][0-9]{4,}
解説: Tencent QQ 番号は 10000 から始まります
中国本土の郵便番号に合わせる	[1-9]\d{5}(?!\d)
コメント: 中国本土の郵便番号は 6 桁です
マッチID	\d{15}\|\d{18}
コメント: 中国本土の ID カードは 15 桁または 18 桁です。
一致する IP アドレス	\d+\.\d+\.\d+\.\d+
コメント: IP アドレスを抽出するときに役立ちます
特定の番号に一致する:
^[1-9]\d*$	// 正の整数に一致
^-[1-9]\d*$	// 負の整数に一致
^-?[1-9]\d*$	// 整数に一致
^[1-9]\d*\|0$	// 非負の整数 (正の整数 + 0) に一致
^-[1-9]\d*\|0$	//正でない整数に一致 (負の整数 + 0)
^[1-9]\d\.\d\|0\.\d[1-9]\d$	// 正の浮動小数点数に一致
^-([1-9]\d\.\d\|0\.\d[1-9]\d)$	// 負の浮動小数点数に一致
^-?([1-9]\d\.\d\|0\.\d[1-9]\d\|0?\.0+\|0)$	// 浮動小数点数に一致
^[1-9]\d\.\d\|0\.\d[1-9]\d\|0?\.0+\|0$	//非負の浮動小数点数に一致 (正の浮動小数点数 + 0)
^(-([1-9]\d\.\d\|0\.\d[1-9]\d))\|0?\.0+\|0$	//非正の浮動小数点数に一致 (負の浮動小数点数 + 0)
コメント: 大量のデータを扱う場合に便利、特定のアプリケーションでの修正に注意
特定の文字列に一致
^[A-Za-z]+$	//英字26文字からなる文字列にマッチ
^[AZ]+$	//英大文字26文字からなる文字列にマッチ
^[az]+$	//英小文字26文字からなる文字列にマッチ
^[A-Za-z0-9]+$	//数字と 26 文字の英字からなる文字列に一致
^\w+$	//数字、26 文字の英字、またはアンダースコアで構成される文字列に一致します

正規表現の完全なコレクション: 正規表現にはさまざまな種類があります。次の表は、PCRE のメタ文字と、正規表現のコンテキストでのそれらの動作の完全なリストです。

キャラクター	説明
\	次の文字を特殊文字、リテラル文字、後方参照、または 8 進エスケープとしてマークします。たとえば、「n」は文字「n」と一致します。「\n」は改行文字に一致します。シーケンス "\\" は "\" に一致し、"\(" は "(" に一致します。
^	入力文字列の先頭に一致します。RegExp オブジェクトの Multiline プロパティが設定されている場合、^ は "\n" または "\r" の後の位置にも一致します。
$	入力文字列の末尾に一致します。RegExp オブジェクトの Multiline プロパティが設定されている場合、$ は "\n" または "\r" の前の位置にも一致します。
*	直前の部分式に 0 回以上一致します。たとえば、zo* は「z」だけでなく「zoo」にも一致します。* {0,} に相当します。
+	直前の部分式に 1 回以上一致します。たとえば、「zo+」は「zo」と「zoo」に一致しますが、「z」には一致しません。+ は {1,} と同等です。
?	直前の部分式と 0 回または 1 回一致します。たとえば、「do(es)?」は、「do」または「dos」の「do」に一致します。? は {0,1} と同等です。
{n}	n は負でない整数です。マッチ判定はn回。たとえば、「o{2}」は「Bob」の「o」には一致しませんが、「food」の両方の o には一致します。
{n,}	n は負でない整数です。少なくとも n 回一致します。たとえば、「o{2,}」は「Bob」の「o」には一致しませんが、「fooooood」のすべての o には一致します。「o{1,}」は「o+」と同等です。「o{0,}」は「o*」と同等です。
{n,m}	m と n はどちらも非負の整数で、n<=m です。少なくとも n 回、最大で m 回一致します。たとえば、「o{1,3}」は「fooooood」の最初の 3 つの o に一致します。「o{0,1}」は「o?」と同等です。コンマと 2 つの数字の間にスペースを入れないでください。
?	この文字が他の修飾子 (*、+、?、{n}、{n,}、{n,m}) のいずれかの直後にある場合、マッチングパターンは貪欲ではありません。非貪欲モードは検索文字列に可能な限り一致しませんが、デフォルトの貪欲モードは検索文字列に可能な限り一致します。たとえば、文字列「oooo」の場合、「o+?」は単一の「o」に一致し、「o+」はすべての「o」に一致します。
.	"\n" を除く任意の 1 文字に一致します。"\n" を含む任意の文字に一致させるには、"[.\n]" のようなパターンを使用します。
（パターン）	パターンに一致し、この一致を取得します。取得した一致は、VBScript では SubMatches コレクションを使用し、JScript では $0...$9 プロパティを使用して、生成された Matches コレクションから取得できます。括弧文字を一致させるには、「$」または「$」を使用します。
（？：パターン）	パターンに一致しますが、一致する結果を取得しません。つまり、取得しない一致であり、後で使用するために保存されません。これは、または文字「(\|)」を使用してパターンの一部を結合する場合に便利です。たとえば、「industr(?:y\|ies)」は「industry\|industries」よりも短い表現です。
(?=パターン)	前方参照。パターンに一致する任意の文字列の先頭にある検索文字列に一致します。これは非取得一致です。つまり、後で使用するために一致を取得する必要はありません。たとえば、「Windows(?=95\|98\|NT\|2000)」は「Windows2000」の「Windows」に一致しますが、「Windows3.1」の「Windows」には一致しません。先読みは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、先読みを含む文字の後ではなく、最後の一致の直後に開始されます。
（？！パターン）	否定先読みは、パターンに一致しない文字列の先頭にある検索文字列に一致します。これは非取得一致です。つまり、後で使用するために一致を取得する必要はありません。たとえば、「Windows(?!95\|98\|NT\|2000)」は、「Windows3.1」では「Windows」と一致しますが、「Windows2000」では「Windows」と一致しません。先読みは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、先読みを含む文字の後ではなく、最後の一致の直後に開始されます。
x\|y	x または y に一致します。たとえば、「z\|food」は「z」または「food」のいずれかに一致します。"(z\|f)ood" は、"zood" または "food" に一致します。
[xyz]	キャラ集合。含まれる文字のいずれかに一致します。たとえば、「[abc]」は「plain」の「a」と一致します。
[^xyz]	負の文字セット。含まれていない任意の文字に一致します。たとえば、「[^abc]」は「plain」の「p」に一致します。
[az]	文字の範囲。指定された範囲内の任意の文字に一致します。たとえば、"[az]" は、"a" から "z" までの範囲の小文字のアルファベットに一致します。
[^az]	負の文字範囲。指定された範囲外の任意の文字に一致します。たとえば、"[^az]" は、"a" から "z" までの範囲にない任意の文字に一致します。
\b	単語境界、つまり単語とスペースの間の位置に一致します。たとえば、"er\b" は "never" の "er" に一致しますが、"verb" の "er" には一致しません。
\B	単語以外の境界に一致します。"er\B" は "verb" の "er" に一致しますが、"never" の "er" には一致しません。
\cx	x で示される制御文字に一致します。たとえば、\cM は Control-M またはキャリッジリターンに一致します。x の値は、AZ または az のいずれかでなければなりません。それ以外の場合は、c をリテラル "c" 文字として扱います。
\d	数字に一致します。[0-9] に相当します。
\D	数字以外の文字に一致します。[^0-9] に相当します。
\f	フォームフィード文字に一致します。\x0c および \cL と同等です。
\n	改行文字に一致します。\x0a および \cJ と同等です。
\r	キャリッジリターンに一致します。\x0d および \cM に相当します。
\s	スペース、タブ、フォームフィードなど、あらゆる空白文字に一致します。[\f\n\r\t\v] と同等。
\S	空白以外の任意の文字に一致します。[^\f\n\r\t\v] と同等。
\t	タブ文字に一致します。\x09 および \cI と同等です。
\v	垂直タブ文字に一致します。\x0b および \cK と同等です。
\w	アンダースコアを含む任意の単語文字に一致します。「[A-Za-z0-9_]」に相当。
\W	単語以外の任意の文字に一致します。「[^A-Za-z0-9_]」と同等。
\xn	n に一致します。ここで、n は 16 進数のエスケープ値です。16 進エスケープ値は、特定の 2 桁の長さでなければなりません。たとえば、「\x41」は「A」に一致します。「\x041」は「\x04&1」と同等です。ASCII エンコーディングは、正規表現で使用できます。.
\num	num に一致します。num は正の整数です。フェッチされたヒットへの参照。たとえば、「(.)\1」は 2 つの連続する同一文字に一致します。
\n	8 進エスケープ値または後方参照を識別します。\n の前に少なくとも n 個のフェッチされた部分式がある場合、n は後方参照です。それ以外の場合、n が 8 進数 (0 から 7) の場合、n は 8 進数のエスケープ値です。
\nm	8 進エスケープ値または後方参照を識別します。nm は、\nm の前に取得された部分式が少なくとも nm ある場合、後方参照です。\nm の前に少なくとも n 回のフェッチがある場合、n は後方参照であり、その後にリテラル m が続きます。上記の条件のいずれも満たされない場合、n と m の両方が 8 進数 (0 から 7) であれば、\nm は 8 進数のエスケープ値 nm と一致します。
\nml	n が 8 進数 (0 から 3) で、m と l の両方が 8 進数 (0 から 7) の場合、8 進数のエスケープ値 nml に一致します。
\国連	n に一致します。n は 4 桁の 16 進数で表される Unicode 文字です。たとえば、\u00A9 は著作権記号 (?) に一致します。

オンラインツールナビゲーション

JSON ツール

フォーマット変換

暗号化と復号化

テキスト番号

通信網

ウェブマスター

計算する

他の

比較リスト

オンライン ツール ナビゲーション