java - 「検索」でテキストの一部を検索

Question

Java 正規表現 (パターン、マッチャー) とfind(). 次のテキストを解析できますか

Mo, We, Su 10:00 - 22:00

の最初の呼び出しがfind()次のグループを返すように

group(1) = Mo
group(2) = 10:00
group(3) = 22:00

の 2 番目の呼び出しはfind()返される必要があります

group(1) = We
group(2) = 10:00
group(3) = 22:00

の 3 番目の呼び出しがfind()返される必要があります

group(1) = Su
group(2) = 10:00
group(3) = 22:00

前もって感謝します。

score 3 · Accepted Answer

仮定

解決

この正規表現を使用できます (スペースを柔軟に設定できます):

(Mo|Tu|We|Th|Fr|Sa|Su)(?=(?: *+, *+(?:Mo|Tu|We|Th|Fr|Sa|Su))* *+(\d+:\d+) *+- *+(\d+:\d+))

上記の正規表現は非常に厳密です。カンマ区切りのリストに現在の曜日と時間範囲の間に何か他のものが含まれている場合 (例: Su, Somethingelse 02:12 - 3:45)、一致は生成されません。

文字列の形式が正しいと完全に確信していて、データを抽出したいだけなら、この緩やかな正規表現で十分です:

([a-zA-Z]+)(?=\D+(\d+:\d+)\D+(\d+:\d+))

それらを文字列リテラルに入れる：

"(Mo|Tu|We|Th|Fr|Sa|Su)(?=(?: *+, *+(?:Mo|Tu|We|Th|Fr|Sa|Su))* *+(\\d+:\\d+) *+- *+(\\d+:\\d+))"
"([a-zA-Z]+)(?=\\D+(\\d+:\\d+)\\D+(\\d+:\\d+))"

説明

(Mo|Tu|We|Th|Fr|Sa|Su)(?=(?: *+, *+(?:Mo|Tu|We|Th|Fr|Sa|Su))* *+(\d+:\d+) *+- *+(\d+:\d+))

([a-zA-Z]+)(?=\D+(\d+:\d+)\D+(\d+:\d+))

この例では、入力文字列内のアルファベット文字のシーケンスは曜日のみであると想定しています。また、数字が存在できるのはタイムスタンプだけだと思います。

1 に答える 1