1

DNA 配列決定によって生成されたフラグメント (しばしばリードと呼ばれます) を組み立てる 1 つの方法は、特定のリード セットのすべてのリードを含む最短の共通スーパーストリングを探すことです。この問題の 1 つのモデルは再構成モデ​​ルです。このモデルは、可能なスーパーストリング (すべてのフラグメントを含む) とフラグメントのそれぞれとの間の最小編集距離を計算します。私がまだ理解していないのは、特定のフラグメントの編集距離を計算するときに、そのフラグメントの逆補数の編集距離を計算する必要があるという事実です。
フラグメントとその逆補体の例:

ACTGTCC フラグメント
TGACAGG 補体 (既知の相補鎖)
GGACAGT 逆補体

私が読んでいる本によると、その背後にあるアイデアは、指定されたフラグメントまたはその逆補数のいずれかがスーパーストリングのおおよそのサブストリングでなければならないという、できるだけ短いスーパーストリングを見つけることです。多くの数学的/計算モデルが生物学的問題を解決する方法について生物学的な意味を持っていないことは知っていますが、この再構築モデルでは、DNA の特定の領域のすべての断片を含む文字列を見つけることは生物学的に合理的であると考えることができます。シーケンス、およびすべての補体フラグメント、結局のところ、アセンブリ時に両方の鎖シーケンスを見つけることができます. しかし、逆補体は、主に保存された領域について話すときに予期されていない、ある種の切断組換えイベントを受けていない限り、特定の配列に対して存在するものではありません. このモデルが逆補数を考慮している理由がわかりましたか? 前もって感謝します。

4

0 に答える 0