大きなファイル (50 GB) があり、その中のさまざまな行の出現回数を数えたいと思います。通常、私は使用します
sort bigfile | uniq -c
ただし、ファイルが十分に大きいため、並べ替えに非常に多くの時間とメモリが必要です。私はそれをできた
grep -cfx 'one possible line'
ファイル内の一意の行ごとに、ただし、これは可能な行ごとにファイルを n 回渡すことを意味します。
何か案は?
関連する質問では、大きなファイルで一意の行を見つける方法について尋ねられますが、それぞれのインスタンスの数を数える方法を探しています-可能な行が何であるかはすでに知っています.