このような改行文字を含むテキストを含むテキストファイルがあります。そのテキストファイルを文字列に読み込みます
random Text
State v. USA
some more text
USA v.
NY
Some more text
USA
v.LA , MN v. ND
USA vs. MN
[大文字で始まる単語] v. [大文字で始まる単語]のようなパターンのオフセット (つまり、開始文字インデックスと終了文字インデックス) を知りたいです。
または [大文字で始まる単語] vs. [大文字で始まる単語]
上記の例では、「State v. USA」 => Start=11 and End=22
"USA v. NY" => Start=36 and End=45
私はこのhttp://rubular.com/r/T7Ii2WDADwのようなものから始めましたが、これはすべてのケースをカバーしていません。
そのため、プログラムは、キーが Start+","+End で、値が "State v. USA" のような実際のテキストである Map を返すことができます。