次のような、すでに行に分割されたシーケンスを含むファイルがあります。
CGCCCATGGGTCGTATACGTAATGGGAAAACAAAGCATGGTGTAACTATGGTAAGTGCTA
GACAATACAAGAAGGCTGATATTTGTAGAATAATTCATTTGAATTATTATGCTGTAAATA
GCTAGATTATTATGCATAATTACTTTGAGAGGTGATCAATCAATTCGACCCTTGCCAATT
たとえば、このファイルで特定のパターンを検索したいGCTGTAAATAGCTAGATTA
。問題は、パターンが予期しない場所で改行によって切断される可能性があることです。
使うことができます :
grep -e "pattern" file
しかし、「改行」文字を避けることができず、結果が得られません。\n
検索でコマンドを無視するように変更するにはどうすればよいですか?
編集:クエリがファイルに存在するかどうかはわかりません。存在する場合は、どこに存在するかわかりません。
私の頭に浮かんだ最善の解決策は
tr -d '\n' < file | grep -e "CTACCCCAGACAAACTGGTCAGATACCAACCATCAGCGAAACTAACCAAACAAA"
しかし、それを行うためのより効率的な方法があるはずです。