自然言語処理の研究に使用している文字列のセットがたくさんあるので、Pythonで保存するための良い方法が欲しいです。
pickleを使用することもできますが、リスト全体をメモリにロードすることは不可能です(私は信じています)。これは、約10 GBの大きさであり、メインメモリがそれほど多くないためです。現在、リストはシェルフライブラリに保存されています...シェルフは文字列「0」、「1」、...、「n」でインデックス付けされていますが、これは少し不格好です。
そのようなオブジェクトを単一のファイルに保存し、それでもランダムに(っぽい)アクセスできるより良い方法はありますか?
最良のオプションは、それを複数のリストに分割することかもしれません。
ありがとう!