巨大なテキスト ファイル (1 GB) を開いて、テキスト マイニングを実行しようとしています。
私はいくつかの正規表現検索を喜んで実行します。
read() 関数を使用すると、次のエラーが発生します。
File "C:\Python33\lib\encodings\latin_1.py", line 26, in decode
return codecs.latin_1_decode(input,self.errors)[0]
MemoryError
私のコードは次のとおりです。
dataFile = open('data/AllData_2000001_3000000.txt', 'r', encoding="latin-1")
print(dataFile.read())
正規表現検索を実行するために、テキストを開く最良の方法は何ですか?
ありがとう!