正規表現のヘルプが必要です。C# を使用します。
括弧内の単語のグループ (丸またはボックスまたはカーリー) は、1 つの単語と見なす必要があります。括弧の外側にある部分は、空白 ' ' に基づいて分割する必要があります。
A) テストケース –
入力 -Andrew. (The Great Musician) John Smith-Lt.Gen3rd
結果 (文字列の配列) –<br> 1. アンドリュー。
2. 偉大な音楽家
3. ジョン
4. スミス-Lt.Gen3rd
B) テストケース –
入力 -Andrew. John
結果 (文字列の配列) –<br> 1. アンドリュー。
2. ジョン
C) テストケース –
入力 -Andrew {The Great} Pirate
結果 (文字列の配列) –<br> 1. アンドリュー
2. 大王
3. 海賊
入力は、個人またはその他のエンティティの名前です。現在のシステムは Access で書かれた非常に古いものです。彼らは一文字一文字スキャンすることでそれを行いました。C#に置き換えています。
私はそれを 2 つのステップで行うことを考えました。最初に括弧ベースの分割、次に単語分割です。
私はこれらのケースを悪い入力として捨てたかった -
開始括弧または終了括弧のみ使用可能
ネストされた括弧
全体として、整形式の (開始括弧がある場合は、終了が必要です) 入力のみを分割したかったのです。