関連情報が複数の行にまたがって非線形に分散していることが多いテキスト ファイルを解析する必要があります。例:
1234
1 IN THE SUPERIOR COURT OF THE STATE OF SOME STATE
2 IN AND FOR THE COUNTY OF SOME COUNTY
3 UNLIMITED JURISDICTION
4 --o0o--
5
6 JOHN SMITH AND JILL SMITH, )
)
7 Plaintiffs, )
)
8 vs. ) No. 12345
)
9 ACME CO, et al., )
)
10 Defendants. )
___________________________________)
原告と被告の身元を引き出す必要があります。
これらの筆記録には非常に多種多様な書式が設定されているため、適切な括弧が存在することや、原告と被告の情報がきちんと区切られていることを常に期待できるとは限りません。たとえば、次のようになります。
1 SUPREME COURT OF THE STATE OF SOME OTHER STATE
COUNTY OF COUNTYVILLE
2 First Judicial District
Important Litigation
3 --------------------------------------------------X
THIS DOCUMENT APPLIES TO:
4
JOHN SMITH,
5 Plaintiff, Index No.
2000-123
6
DEPOSITION
7 - against - UNDER ORAL
EXAMINATION
8 OF
JOHN SMITH,
9 Volume I
10 ACME CO,
et al,
11 Defendants.
12 --------------------------------------------------X
2 つの定数は次のとおりです。
- 「原告」は、原告の名前の後に表示されますが、必ずしも同じ行にあるとは限りません。
- 原告と被告の名前は大文字になります。
何か案は?