1

Fortranのフォーマットされていないデータファイルを読み取り、ASCII出力を新しいファイルoutput.datに書き込むこのコードがあります。この output.dat ファイルを numpy 配列に読み込みたいです。ただし、fromfile ユーティリティは奇妙な値を読み取ります。これは、「dtype」の不一致によるものと思われます。考えられるすべての dtype を試しましたが、まだ適切な値が得られません。誰かが私がここで何をすべきかを教えてくれますか?

フォーマットされていないFortranを読み取り、ASCIIを書き込み、ASCIIファイルをnumpy配列に読み取る私のコード:

# Code unformatierten Fortran-Dateien mit Python lesen

import numpy as np
from struct import *
import fortranfile as fofi
from array import array

f = fofi.FortranFile('extract.bin',endian='>',header_prec='i')
x = f.readInts()
xx = f.readReals('f')

print x
print 'Die Lange von x ist',len(x)
print 'Dies ist'
print xx[0:20]
print 'Die Lange ist',len(xx)
dd = list(xx)
d  = list(x)


df=len(xx)/8
print 'Der Wert ist',df
g = fofi.FortranFile('output.dat',mode='w')
g.writeRecord(str(d))
g.write('\n')
g.writeRecord(str(dd))
g.close()

filename = open('output.dat','rb')
field = np.fromfile(filename,dtype=np.float64)
filename.close()
print field

Python はフォーマットされていない fortran を読み取り、出力ファイルに次のように書き込みます。このファイルには、削除方法がわからない DLE、FS、および NUL 文字が含まれています。「YS」文字も変換の一部です。

  [1, 167, 133, 6]   
YS [0.0, 4.3025989e-07, 1.5446712e-06, 3.1393029e-06, 5.0430463e-06, 7.1382601e-06, `9.301104e-06, 1.1476222e-05, 1.3561337e-05, 1.5552534e-05, 1.7355138e-05, 1.9008177e-05, `2.0416919e-05, 2.1655113e-05, 2.2624969e-05, 2.3426954e-05, 2.3961067e-05, 2.4346635e-05, 2.4482841e-05, 2.4501234e-05, 2.4301233e-05, 2.4020905e-05, 2.3559202e-05, 2.3056287e-05, 2.2411346e-05, 2.1758024e-05, 2.1005515e-05, 2.0265579e-05, 1.9453466e-05, 1.8686056e-05, 1.7860904e-05, 1.7103739e-05, 1.6299076e-05, 1.5573576e-05, 1.4809892e-05, 1.4126301e-05, 1.3412908e-05, 1.2775883e-05, 1.2116507e-05, 1.1522323e-05, 1.0915101e-05, 1.0356307e-05, 

現在、私の出力は

[  1 167 133   6]
Die Lange von x ist 4 // The length of x is
Dies ist  // This is ( The actual value)
[  0.00000000e+00   4.30259888e-07   1.54467125e-06   3.13930286e-06
   5.04304626e-06   7.13826012e-06   9.30110400e-06   1.14762224e-05
   1.35613373e-05   1.55525340e-05   1.73551380e-05   1.90081773e-05
   2.04169191e-05   2.16551125e-05   2.26249686e-05   2.34269537e-05
   2.39610672e-05   2.43466347e-05   2.44828407e-05   2.45012343e-05]
Die Lange ist 133266 // The length is
Der Wert ist 16658  // The value (after reading with numpy) is
[  4.66529177e-062   3.47245665e-313   3.28870023e-086 ...,
   1.05249949e-153   1.69339332e-052   3.30673243e+093]

numpy 読み取り後の値は、その前の配列と同じではありません。これを修正して、これらすべての値を選択したnumpy配列に読み込むにはどうすればよいですか? また、Fortran のフォーマットされていないファイルを読むためのより良い提案があれば、コメントしてください。

4

1 に答える 1

1

Linux を使用している場合は、翻訳ユーティリティtrを使用して、 0-9 + - を除くすべての文字を削除します。ef inf NaN ブランク タブ 改行:

tr -C -d '0-9 + \- . ef EF inf NaN \t\n'  < in  > out  # delete non-numbers

(それがあなたがやりたいことかどうかはよくわかりません)。

また、fromfile( file, sep=' ' )
空白 (空白、タブ、改行) で区切られた数字を含むテキスト ファイルを読み取るために使用します。
デフォルトsep=''は、バイナリ ファイルの読み取り用です。

ヴィエル・グリュック

于 2013-07-30T14:05:30.173 に答える