最近、大規模なデータセットの度数分布を示すヒストグラムを作成する必要があります。データセットが小さい場合、これは簡単な作業です。ただし、プロットする必要があるデータ セットには約 800000000 個の数値が含まれており (各数値が 4 バイトであると仮定します)、それらはすべて 1 つのテキスト ファイルに 1 行に 1 つずつ格納されています。テキスト ファイルは約 4 GB です。GNUPLOT を試してみましたが、このデータ セットを処理するための十分なメモリがありません。誰かがこの問題を解決する方法、またはこの仕事をするための他のツールを提案できますか?
ありがとう、トム