正規表現を使用したパターンマッチングの経験はこれが初めてなので、助けていただければ幸いです。
次の部分文字列の文字列を検索しようとしています。
"(TPU 1-999)
http://somewebaddress.com"
TPU
、1-999
およびリンクを個別のサブ文字列として保持したいと思います。
これは私が使用しているパターンです:
^\s{3}\(([AEINPRSTUW]{3})\s(\d{1,3}.\d{2,5})\)$^\s{3}(http+\s{1,100})$
私の推論を説明するためにそれを分解します
^\s{3}
-文字列(この場合は行)の先頭、その後に3つのスペース
\(
-左括弧
([AEINPRSTUW]{3})
-括弧内の任意の文字の3つのインスタンス、TPUは1つの例です
\s(\d{1,3}.\d{2,5})
-スペースと1〜3桁の数字、さらに2〜5桁の数字から任意の文字で区切る
\)$
-右括弧、行末
^\s{3}
-次の行の先頭に3つのスペースが続きます
(http+\s{1,100})$
-文字「http」の後に1〜100文字の非空白文字が続き、行の終わり。
このパターンは現在機能していませんが、正しい方向に向かっていますか?