スペースを桁区切り記号として使用するテキストを扱っています。たとえば、400 または 40 000 または 40 000 000 または 4 000 000 000 です。文字列内の数字を識別する必要があります。識別されたら、番号を再フォーマットするための多くのオプションがあります。私は正規表現の新人です。これは機能しません:
import re
line = '40) He had 120 hours to increase from 40 000 units to 20 000 000.'
regex = re.compile("(\d+ *\d+)")
re.findall(regex, line)
['40', '120', '40 000', '20 000', '000']