DNA 配列のオープンリーディングフレームを識別するコードを書こうとしています。ORF は、ATG で始まり終止コドン TAG、TAA、または TGA で終わる配列の一部として定義されます。先読み式を使用して、重複するシーケンスを見つけました。ただし、最長の文字列のみを印刷したいです。
(?=(ATG(?:[ATGC]{3}){%d,}?(?:TAG|TAA|TGA)))' % (aa)
DNA 配列のオープンリーディングフレームを識別するコードを書こうとしています。ORF は、ATG で始まり終止コドン TAG、TAA、または TGA で終わる配列の一部として定義されます。先読み式を使用して、重複するシーケンスを見つけました。ただし、最長の文字列のみを印刷したいです。
(?=(ATG(?:[ATGC]{3}){%d,}?(?:TAG|TAA|TGA)))' % (aa)