次のようなデータファイルがあります。
group Head:
data1: abc data2: def
2word data3: ghi data4: jkl
data3: mno three word data4: pqr stu
だからPythonで私はこのような正規表現を構築しました:
Data = re.findall(r'(([\w\(\)]+[ \t\f]?)+):([ \t\f]*(\S+))', data)
私のファイルは 600 行近くあり、多くの場合、上記のように 2 列あり、ファイルごとに解析に数分かかります。
ファイルごとに 10 秒未満で実行できるように、このコードをより効率的にするにはどうすればよいでしょうか?