したがって、この質問は私を悩ませており、他に何百万ものプロジェクトを抱えているので、これを解決したいと思っていました. これまでのところ、私は答えを見つけることができませんでした。とてもシンプルに思えます。私が使用した:
awk '$1' merged_counts.txt |sort|uniq -d|wc
216行になりました。しかし、その数は正しくありません。私が使用する場合
more merged_counts.txt|cut -f 1|sort|uniq -d|wc
正しい 271 行が表示されます。私が使用する場合
awk '{print $1}' merged_counts.txt |sort|uniq -d|wc
271 行も表示されますが、残りのフィールドも失われます。初歩的なことのように見えるものに対して、なぜこのように動作するのかわかりません。ヘルプ/提案をありがとう。きっと何かを見落としているに違いない。
ファイルの例:
B3GALT1 72 128 65 124 87 118 102 117 38 106 87 115 27 20 89 30
AMY1A 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
PSENEN 654 459 648 462 508 399 537 532 696 460 625 473 621 322 633 434
遺伝子「AMY1A」は、両方の DNA 鎖に注釈が付けられている遺伝子の 1 つであり、ファイルに 2 回表示されます。