大きなファイル (~100MB) を考えてみましょう。ファイルが行ベース (比較的短い行 ~80 文字のテキスト ファイル) であると考えてみましょう。組み込みのopen()
/を使用file()
すると、ファイルは遅延してロードされます。IE を実行aFile.readline()
すると、ファイルのチャンクのみがメモリに常駐します。urllib.urlopen() は (ディスク上のキャッシュを使用して) 同様のことを行いますか?
urllib.urlopen().readline()
とのパフォーマンスの違いはどれくらいfile().readline()
ですか? ファイルが localhost にあると考えてみましょう。で開きurllib.urlopen()
、次にで開きfile()
ます。でファイルをループすると、パフォーマンス/メモリ消費の違いはどれくらいになりますreadline()
か?
経由で開かれたファイルを処理する最良の方法は何urllib.urlopen()
ですか? 行ごとに処理する方が速いですか?または、一連の行(〜50)をリストにロードしてから、リストを処理しますか?