キーと値のペアの値をカウントしているときにうまく機能する awk reducer プログラムを以下に示します。
#!/bin/awk -f
BEGIN {FS="\t";
}
{ A[$1]+=$2;
}
END {
for(i in A)
{printf("%s\t %d\n" ,i ,A[i])}
}
上記のレデューサーはうまく機能しますが、それを書くための最適化された方法はありますか...?
入力:
APPLE 1
APPLE 1
1
ORANGE 1
ORANGE 1
MANGO 1
BANANA 1
1
1
1
ORANGE 1
1
APPLE 1
BANANA 1
出力:
APPLE 3
BANANA 2
MANGO 1
ORANGE 3
5