次のような形式のファイルがいくつかあります。
TCTCTGGAAAGGGACGCCTGGGGAGG 10 AAAAATACATTCTAACCTCGGCGT 1 TAATTTCATCAATATATCAATG 1 (等...)
最後にこれだけが得られるように、スペースの後のすべてを削除したい:
TCTCTGGAAAGGGACGCCTGGGGAGG AAAAATACATTCTAACCTCGGCGT TAATTTCATCAATATATCATG (等...)
どうすればいいですか?
次のような形式のファイルがいくつかあります。
TCTCTGGAAAGGGACGCCTGGGGAGG 10 AAAAATACATTCTAACCTCGGCGT 1 TAATTTCATCAATATATCAATG 1 (等...)
最後にこれだけが得られるように、スペースの後のすべてを削除したい:
TCTCTGGAAAGGGACGCCTGGGGAGG AAAAATACATTCTAACCTCGGCGT TAATTTCATCAATATATCATG (等...)
どうすればいいですか?
awkでこれを行うことができます:
cat oldfile | awk '{print $1}' > newfile
cut -d' ' -f1 file.txt
また:
sed 's/ .*//' file.txt
また
sed -e 's/[^ACTG]//g' file.txt
また
awk '{print $1}' file.txt
timosの回答ほど簡潔できれいではありません:)が、同じ機能をRubyで記述した別の簡単な例です。
#!/usr/bin/env ruby
data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close