約1200万行のファイルがあり、各行は次のようになります。
0701648016480002020000002030300000200907242058CRLF
私が達成しようとしているのは、データの前に行番号を追加することです。番号は固定長でなければなりません。
この背後にある考え方は、このファイルを SQLServer テーブルに一括挿入し、各行に一意の識別子を必要とする特定の操作を実行できるようにすることです。データベース側でこれを試してみましたが、良いパフォーマンスを達成できませんでした (少なくとも 4 フィート未満、1 フィート未満が理想的です)。
現在、私はこのような解決策をPythonで試しています。
file=open('file.cas', 'r')
lines=file.readlines()
file.close()
text = ['%d %s' % (i, line) for i, line in enumerate(lines)]
output = open("output.cas","w")
output.writelines(str("".join(text)))
output.close()
これが機能するかどうかはわかりませんが、新しいことを試す前に、どのように機能し、副作用があるかを理解するのに役立ちます.
低レベル言語でそれを行うのに役立ちますか? 誰もこれを行うためのより良い方法を知っていますか?私はそれが行われたと確信していますが、何も見つけることができません.
ありがとう