テキストファイルから情報を取得しようとしています。必要なものを一致させることができます。問題は、一致が多すぎることです。
情報はテキスト内で数回繰り返されます。繰り返しの間に一意のテキストがありますが、このテキストに遭遇したときに一致するものを停止する方法がわかりません. 先読みの後に \s 以外のものを置くと、正規表現が壊れているようです。
これを行う方法があることを願っていますが、それが失敗した場合は、取得する一致の量を制限する方法があります.
これが私が今持っているものと私が探しているもののサンプルです:
(?<=anniversary\s|\s<plaintext>).+(?=\s+)
<subpod title=''>
<plaintext>birth of Gustav Schäfer (1988- ): 25th anniversary
birth of Arrelious Benn (1988- ): 25th anniversary
birth of Brad Silberling (1963- ): 50th anniversary
birth of Robert Lavette (1963- ): 50th anniversary
Harvard University founded (1636): 377th anniversary
Germany joins the League of nations (1926): 87th anniversary
first Miss America crowned (1921): 92nd anniversary
"Blondie" is first published (1930): 83rd anniversary
Galveston Hurricane of 1900 (1900): 113th anniversary
USAir Flight 427 crashes (1994): 19th anniversary</plaintext>
<img src='http://www4b.wolframalpha.com/Calculate/MSP/MSP18771b2386h4e5i137b400002gg7ehc7hh7c2h17?MSPStoreType=image/gif&s=40'
alt='birth of Gustav Schäfer (1988- ): 25th anniversary
birth of Arrelious Benn (1988- ): 25th anniversary
birth of Brad Silberling (1963- ): 50th anniversary
birth of Robert Lavette (1963- ): 50th anniversary
Harvard University founded (1636): 377th anniversary
Germany joins the League of nations (1926): 87th anniversary
どんな助けでも大歓迎