目次である次の文字列を考えてみましょう
Table of Content
Name abc ......... 20
Name fghkjkj kjkj . 31
Name.with.dot ..... 45
Name abc
セクションの名前 ' ' Name fghkjkj kjkj
' および ' Name.with.dot
'を抽出したい
その目標を達成するための適切な正規表現をまだ見つけていません。洞察はありますか?
目次である次の文字列を考えてみましょう
Table of Content
Name abc ......... 20
Name fghkjkj kjkj . 31
Name.with.dot ..... 45
Name abc
セクションの名前 ' ' Name fghkjkj kjkj
' および ' Name.with.dot
'を抽出したい
その目標を達成するための適切な正規表現をまだ見つけていません。洞察はありますか?
私は以下がうまくいくはずだと思います:
^.*?(?= \.+ \d+$)
行ごとに作業しているか、MULTILINE
モードを有効にしていると仮定します。正の先読みアサーションにより、行にドットと数字のみが続くとすぐに一致を終了することが保証されます。
説明:
^ # Start of line
.*? # Match any number of characters, as few as possible
(?= # Look ahead to assert that the following matches from here:
[ ] # a space
\.+ # one or more dots
[ ] # a space
\d+ # a number
$ # End of line
) # End of lookahead