解析しようとしているファイルにテキストがあります。
次のテキスト ファイルを検討してください。
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
1. Line 1
2. Line 2
+ Line 1
+ Line 2
+ Line 3
テキスト ファイルには 3 つの段落があります。
まず、いくつかの文です。2 つ目は、文と番号付きリストです。3 つ目は簡単な箇条書きリストです。
私の質問は、Objective-C で、段落構成が単なる文である場合、それらを NSString として返し、箇条書きリストである場合、それらを NSArray で区切り、段落が文と番号付きリストの組み合わせで、NSString と NSArray の両方の辞書として返します。
何か案は?正規表現を使用してそれらを配列または文字列に分離できることは知っていますが、パラが次のものであるかどうかを検出して検証する方法がよくわかりません。
- 段落(文)
- 箇条書き/番号付きリスト。
- リストとパラの組み合わせ
正規表現に関する一連のチュートリアルとSOの質問を読んだ後、これを試しました。
この式(?=\d*\s*[\.]?\s*)([a-z\s]+)
は番号付きリストを取得しますが、リストの前にあるテキストも取得します。それは私が完全に立ち往生しているところです。