0

関心のあるデータを含む多数の .txt ファイル (N > 1000) があり、「平均」値が特定のしきい値 (0.5 など) を超えるファイルを特定し、そのファイルの名前を出力したいと考えています。それが事実です。各ファイルのデータは次のように編成されます。

[
    {
      "parameter": {
          "max": 0.6640571758027143,
          "mean": 0.13404294175225137,
          "min": 0.0,
          "std": 0.09435715828616785
      },
      {
        "intensity": [
            {
                "max": [
                    3.1719575216784217
                ],
                "mean": [
                    -3.552713678800501e-17
                ],
                "min": [
                    -2.707115982837323
                ],
                "std": [
                    1.0000000000000004
                ]
                ...

少し複雑にするために、「強度」ではなく「パラメータ」の「平均」値のみを読みたいと思います。

次のコードを大まかに含む for ループを使用して、このファイルを読み取る必要があるという考えがありました。

subjects = [allmyfilenames]
for subj in subjects:
    file = open('C:/%s.txt' %subj, 'r')
    for line in file.readlines(): print line

そこから、私は少し迷っています。しきい値 (0.5) との照合に使用する正しい線を特定するにはどうすればよいですか?

4

1 に答える 1

0

このようなものを試してみてください。データ形式は完全にはわかりませんでしたが、上記のデータ形式ではこのようなものが機能する可能性があります。未検証**

subjects = [allmyfilenames]
    for subj in subjects:
        with open('C:/%s.txt' %subj, 'r') as datafile:
            data = json.load(datafile)
            if data[0]['parameter']['mean'] > 0.5:
                print subj
于 2012-11-06T03:59:42.647 に答える