この例のように、スペースで区切られた ASCII テキストの数字を含む単純なテキスト ファイルがあります。
150604849
319865.301865 5810822.964432 -96.425797 -1610
319734.172256 5810916.074753 -52.490280 -122
319730.912949 5810918.098465 -61.864395 -171
319688.240891 5810889.851608 -0.339890 -1790
*<continues like this for millions of lines>*
基本的に、最初の行をそのままコピーし、その後のすべての行で、最初の値 (x) をオフセットし、2 番目の値 (y) をオフセットし、3 番目の値を変更せずにオフセットし、最後の数値の半分にします。
Python の学習経験として、次のコードをまとめました (下品で攻撃的である場合は申し訳ありませんが、本当に攻撃的ではないことを意味します)。問題なく動作します。ただし、私が使用している入力ファイルのサイズは数 GB であり、実行を高速化する方法があるかどうか疑問に思っています。現在、740 MB のファイルの場合、2 分 21 秒かかります
import glob
#offset values
offsetx = -306000
offsety = -5806000
files = glob.glob('*.pts')
for file in files:
currentFile = open(file, "r")
out = open(file[:-4]+"_RGB_moved.pts", "w")
firstline = str(currentFile.readline())
out.write(str(firstline.split()[0]))
while 1:
lines = currentFile.readlines(100000)
if not lines:
break
for line in lines:
out.write('\n')
words = line.split()
newwords = [str(float(words[0])+offsetx), str(float(words[1])+offsety), str(float(words[2])), str((int(words[3])+2050)/2)]
out.write(" ".join(newwords))
どうもありがとう