私は正規表現が苦手なので、作業中のいくつかの表現に役立つことがあります。次のようなテキスト行がありText here then 999-99
、最後にその数列を分離したいと思います。またはのいずれ999-99
か999-99-9
です。以下はうまくいくようです:
\d{3}-\d{2}(-\d{1})?
しかし、数列の後にテキストを追加でき、それでも一致するため、実際にはテキスト内のどこかを検索しているように見えます。これはより厳密である必要があるため、行はこの正確なシーケンスで終了し、その後は何も終了しない必要があります。$
の代わりにで終了しようと?
しましたが、一致が作成されないようです(常にfalseが返されます)。
また、文字の置換に役立つ情報を使用することもできます。OCRスキャンを処理するプログラムに取り組んでいますが、返される文字列値に、܀
記号で表される表示できない文字が含まれている場合があります。܀
文字をスペースに置き換える正規表現はありますか?