これが私の現在の正規表現です: [^\s][\.,\?!:][\w]. などのすべての句読点の後にスペースがあるかどうかを確認する必要があり[.,!:?]ます。しかし、問題があります。チェックインしているファイルのタイプは*.sgmであるため、次のような特定のタグがあります。
<at.cit><at.cit>> </at.cit> <case.cit><lit> </lit></case.cit>
例えば:
<ptext>Text.Text<at.cit>Text</at.cit></ptext>
したがって、一致する"t.T"必要があるのは、ピリオドの後にスペースが必要だからです。しかし、私の正規表現は"t.T"and"t.c"と"t.c". これらのタグを削除するにはどうすればよいですか?
ご助力いただきありがとうございます。