python - テキストファイルからのデータの解析

Question

次のような内容のテキストファイルがあります。

******** ENTRY 01 ********
ID:                  01
Data1:               0.1834869385E-002
Data2:              10.9598489301
Data3:              -0.1091356549E+001
Data4:                715

次に空の行があり、より類似したブロックが繰り返され、それらはすべて同じデータフィールドを持ちます。

私はC++コードをPythonに移植しており、特定の部分がファイルを1行ずつ取得し、テキストタイトルを検出してから、各フィールドテキストを検出してデータを抽出します。これはまったくスマートなコードのようには見えません。Python には、このようなデータを簡単に解析するためのライブラリが必要だと思います。結局のところ、ほとんど CSV のように見えます。

これについて何か考えはありますか？

score 4 · Accepted Answer

my_file:

******** ENTRY 01 ********
ID:                  01
Data1:               0.1834869385E-002
Data2:              10.9598489301
Data3:              -0.1091356549E+001
Data4:                715

ID:                  02
Data1:               0.18348674325E-012
Data2:              10.9598489301
Data3:              0.0
Data4:                5748

ID:                  03
Data1:               20.1834869385E-002
Data2:              10.954576354
Data3:              10.13476858762435E+001
Data4:                7456

Python スクリプト:

import re

with open('my_file', 'r') as f:
    data  = list()
    group = dict()
    for key, value in re.findall(r'(.*):\s*([\dE+-.]+)', f.read()):
        if key in group:
            data.append(group)
            group = dict()
        group[key] = value
    data.append(group)

print data

印刷出力:

[
    {
        'Data4': '715',
        'Data1': '0.1834869385E-002',
        'ID': '01',
        'Data3': '-0.1091356549E+001',
        'Data2': '10.9598489301'
    },
    {
        'Data4': '5748',
        'Data1': '0.18348674325E-012',
        'ID': '02',
        'Data3': '0.0',
        'Data2': '10.9598489301'
    },
    {
        'Data4': '7456',
        'Data1': '20.1834869385E-002',
        'ID': '03',
        'Data3': '10.13476858762435E+001',
        'Data2': '10.954576354'
    }
]

score 0 · Accepted Answer

非常に単純なアプローチは

all_objects = []

with open("datafile") as f:
    for L in f:
        if L[:3] == "***":
            # Line starts with asterisks, create a new object
            all_objects.append({})
        elif ":" in L:
            # Line is a key/value field, update current object
            k, v = map(str.strip, L.split(":", 1))
            all_objects[-1][k] = v

python - テキスト ファイルからのデータの解析

3 に答える 3

Related

Reference

python - テキストファイルからのデータの解析