Pythonで外部ソートを実装していますが、現在この問題に悩まされています。整数を含む大きなテキスト ファイルを小さなチャンクに分割し、これらのチャンクを並べ替えようとしています。ここまで書けるようになりました。
with open(fpath,'rb') as fin:
input_iter = iter(lambda: fin.read(40 * 1024),'')
for item in input_iter:
print item
current_chunk = list(item)
# sort the buffers
current_chunk.sort(key = lambda x : int(x))
このコードを実行すると、エラーが発生しました
File "problem3.py", line 68, in <lambda>
current_chunk.sort(key = lambda x : int(x))
ValueError: invalid literal for int() with base 10: ''
これinput_iter = iter(lambda: fin.read(40 * 1024),'')
は、この問題を克服するための別の方法です。ありがとうございました