テキスト内のアイテムを解析するには正規表現が必要です。
データの構造は次のとおりです。
- 何かを含むアイテムコード
- いくつかのオプションのフラグ AA BB CC DD
- と数量
私はこの正規表現を使用しています:
.*\n(.+) (AA|BB|CC|DD|EE|[, ]+){0,6}(\d+).*
このテキスト文字列では:
Sveiki,
I need these items:
1508-dkh-ą9 AA, BB 100
1efae 468 BB, CC 100
2efae 468 BB 100
3efae 468 100
Ačiū už dėmesį ir skirtą laiką!
戻る
<row>
<ID>0</ID>
<Match>1508-dkh-Ä…9 AA, BB 100</Match>
<Group1>1508-dkh-Ä…9 AA, BB</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>1</ID>
<Match>1efae 468 BB, CC 100</Match>
<Group1>1efae 468 BB, CC</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>2</ID>
<Match>2efae 468 BB 100</Match>
<Group1>2efae 468 BB</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
<row>
<ID>3</ID>
<Match>3efae 468 100</Match>
<Group1>3efae 468</Group1>
<Group2></Group2>
<Group3>100</Group3>
</row>
そして、私はこのような結果が必要です
<row>
<ID>0</ID>
<Match>1508-dkh-Ä…9 AA, BB 100</Match>
<Group1>1508-dkh-Ä…9</Group1>
<Group2>AA, BB</Group2>
<Group3>100</Group3>
</row>
....
どうすればこの結果を達成できますか? (正規表現よりも優れた解決策があるのではないでしょうか?)