1

次のような形式のファイルがいくつかあります。

TCTCTGGAAAGGGACGCCTGGGGAGG 10
AAAAATACATTCTAACCTCGGCGT 1
TAATTTCATCAATATATCAATG 1
(等...)

最後にこれだけが得られるように、スペースの後のすべてを削除したい:

TCTCTGGAAAGGGACGCCTGGGGAGG
AAAAATACATTCTAACCTCGGCGT
TAATTTCATCAATATATCATG
(等...)

どうすればいいですか?

4

3 に答える 3

2

awkでこれを行うことができます:

cat oldfile | awk '{print $1}' > newfile
于 2012-06-24T19:26:04.093 に答える
2
cut -d' ' -f1 file.txt

また:

sed 's/ .*//' file.txt

また

sed -e 's/[^ACTG]//g' file.txt

また

awk '{print $1}' file.txt
于 2012-06-24T19:37:08.173 に答える
0

timosの回答ほど簡潔できれいではありません:)が、同じ機能をRubyで記述した別の簡単な例です。

#!/usr/bin/env ruby

data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close
于 2012-06-24T19:41:15.537 に答える