0

縮重ヌクレオチド配列を使用する 15 mer のヌクレオチド モチーフがあります。例: ATNTRTCNGGHGCN。

このモチーフが出現する配列のセットを検索します。しかし、私の他のシーケンスは正確なシーケンスです。つまり、あいまいさはありません。

これを検索するためにシーケンス内でループを実行しようとしましたforが、正確でない検索を行うことができませんでした。私が使用するコードは、Biopython cookbookのコードをモデルにしています。

for pos,seq in m.instances.search(test_seq):
    print pos, seq

非正確な 15-mer のすべての可能な正確なインスタンスを検索したいと思います。利用可能な機能はありますか、それとも独自の機能を定義する必要がありますか? (私は後者を行っても大丈夫です。先に進む前に、他の誰かの努力を複製していないことを世界にトリプルチェックしたかっただけです-ドキュメントの関連部分であると思われるものをすでに閲覧しました。)

4

1 に答える 1

3

Biopython の を使用しますnt_search。DNA シーケンス内のサブシーケンスを検索し、曖昧なコードをその位置の可能なヌクレオチドに展開します。例:

>>> from Bio import SeqUtils
>>> pat = "ATNTTRTCNGGHGCN"
>>> SeqUtils.nt_search("CCCCCCCATCTTGTCAGGCGCTCCCCCC", pat)
['AT[GATC]TT[AG]TC[GATC]GG[ACT]GC[GATC]', 7]

最初の項目が検索パターンで、その後に一致する位置が続くリストを返します。

于 2013-08-29T23:09:20.977 に答える