オンライン ツールを使用して .txt に変換した PDF ファイルがあります。その中のデータを解析し、正規表現を使用して分割したいと思います。私はほぼ完了しましたが、1点で立ち往生しています。
データの例は次のとおりです。
00 41 53 Bid Form – Design/Build (Single-Prime Contract)
27 05 13.23 T1 Services
私はそれを次のように分割したい:00 41 53 Bid Form – Design/Build (Single-Prime Contract)
そして他のものは27 05 13.23 T1 Services
私が使用している正規表現は[0-9](\d|\ |\.)*(\D)*
(
スペースおよび/またはドットを含む数字と、(文字、ドット、コンマ)
、、、、-
および数字) のテキストを使用できます。
上記の「T1 サービス」のように文字列に数字が含まれていると、文字列を照合できません。