正規表現を使用したパターンマッチングの経験はこれが初めてなので、助けていただければ幸いです。
次の部分文字列の文字列を検索しようとしています。
"(TPU 1-999)
http://somewebaddress.com"
TPU、1-999およびリンクを個別のサブ文字列として保持したいと思います。
これは私が使用しているパターンです:
^\s{3}\(([AEINPRSTUW]{3})\s(\d{1,3}.\d{2,5})\)$^\s{3}(http+\s{1,100})$
私の推論を説明するためにそれを分解します
^\s{3}-文字列(この場合は行)の先頭、その後に3つのスペース
\(-左括弧
([AEINPRSTUW]{3})-括弧内の任意の文字の3つのインスタンス、TPUは1つの例です
\s(\d{1,3}.\d{2,5})-スペースと1〜3桁の数字、さらに2〜5桁の数字から任意の文字で区切る
\)$-右括弧、行末
^\s{3}-次の行の先頭に3つのスペースが続きます
(http+\s{1,100})$-文字「http」の後に1〜100文字の非空白文字が続き、行の終わり。
このパターンは現在機能していませんが、正しい方向に向かっていますか?