電話番号に一致する単純な正規表現を作成しました。ニューヨークの入力文字列に複数のグループが含まれている場合、スペース、ドット、ハイフンのいずれかを選択するグループが内部にあります...結果全体と一致しません。
([\(]?\d+[\)]?(-|\s|\.)?\d+)+
入力は(123)1234-1236 12345
、またはそのようなものです...実際の入力はTesseract OCRからのものであり、せいぜい信頼性がありません。
より使いやすくわかりやすい正規表現を作成するか、電話番号と一致するように正規表現を改善するのを手伝ってくれませんか。