これが私の現在の正規表現です: [^\s][\.,\?!:][\w]
. などのすべての句読点の後にスペースがあるかどうかを確認する必要があり[.,!:?]
ます。しかし、問題があります。チェックインしているファイルのタイプは*.sgm
であるため、次のような特定のタグがあります。
<at.cit><at.cit>> </at.cit> <case.cit><lit> </lit></case.cit>
例えば:
<ptext>Text.Text<at.cit>Text</at.cit></ptext>
したがって、一致する"t.T"
必要があるのは、ピリオドの後にスペースが必要だからです。しかし、私の正規表現は"t.T"
and"t.c"
と"t.c"
. これらのタグを削除するにはどうすればよいですか?
ご助力いただきありがとうございます。