私は2つのファイルを持っています.1つはfasta
ファイルで、もう1つはfastq
ファイルです。fasta
を取得し、各行を読み取り、fastq
ファイル内の各行を検索して、一番上の行と一番下の行を出力したいと考えています。これは私が持っているものです
fasta ファイル
読み取り1
あああああああああああああああああああああああああああああああああああああ
ああああああああああああああああああああああああああああああああああああああ
ああああああああああああああああああああああああああああああああああああああ
あああああああああああああああああああああああああああああああああああああ
あああああああああああああああああああああああああああああああああああああああ
for seq in `cat sequences`;do grep -A 2 -B 1 $seq FAP.1.txt;done
@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################
@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+ ;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1209:10703:35361 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+
@@@FFFFFHGHHHGIJHFDDDDDBDD69@6B-707537BDDDB75@@85
@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
@CFFFFFFHHHHHJJJHFDDD@77BDDDDB077007@B############
このことから、それが 2 回表示されていることがわかりますがAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
、印刷したいのは 1 回だけです。どうやってやるの?
最終出力ファイル
@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################
@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+
;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
@CFFFFFFHHHHHJJJHFDD@77BDDDDB077007@B