次のようなデータファイルがあります。
82 DEX26_28_h
82 DEX26_28_h
873 DEX34_h
89 DEX37_h
1 DEX34_h
そして、列 to の各項目 (17 個の一意) が互いに隣り合うように、$2 で並べ替えるつもりです。次に、$2 につながれている間に $1 のすべての # を合計したいと思います
上記のテストファイルの理想的な結果:
164 DEX26_28_h
874 DEX34_h
89 DEX27_h
わかる?基本的に、各サンプル ($2) で発生するシーケンスの総数 ($1) を合計する必要があり、合計を維持しながら uniq は $2 のみです。最終結果が合計17行になるようにします。
$2 の 17 の Identifies ごとに grep を実行し、 awk を使用してそれらを合計する必要がありますか?
皆さんはどう思いますか?