私は自分自身を書こうとしていますが、アグリゲーター/ヒストグラムとして使用できる宝石/ライブラリがあるかどうか疑問に思っていました
私の目標は、一致するキーに基づいて値を合計することです:
["fish","2"]
["fish","40"]
["meat","56"]
["meat","1"]
一意のキーごとに値を合計して、 を返す必要が["fish","42"]
あり["meat","57"]
ます。集約する必要があるファイルは比較的大きく、tsv キーと値のペアで構成される約 4 GB のテキスト ファイルです。私の目標は、一時ファイルを使用しないようにすることです。マシン上に多くのスペースがあるので、すでに最適化された同様のものが既に存在するかどうか疑問に思っていました.githubで「ヒストグラム」という名前のジェブを見つけましたが、必要な機能が実際には含まれていませんThx