3

ハフマンおよび適応形ハフマンアルゴリズムではなく、圧縮技術を使用してDNAシーケンスを圧縮したいのですが、プログラミング言語としてc#を使用しています。誰かが私をアルゴリズムに導くことができますか?注:可逆圧縮が必要です

4

1 に答える 1

6

DNA配列を使用すると、4つの可能な状態があります。

  • グアニン(G、00
  • シトシン(C、01
  • アデニン(A、10
  • チミン(T、11

2ビットを使用して、値を角かっこで囲んだ4つの可能な状態を格納できます。この単純な方法を使用すると、1バイトに4つの異なる値を格納できます。


更新
@kolが述べたように、データをさらに縮小するために、実質的に任意の圧縮アルゴリズムを使用できます。現在、.NETには2つの圧縮方法(DeflateとGZip)が付属しており、SharpZipLibオープンソースライブラリにはさらに多くの方法があります。

于 2011-12-19T18:16:56.463 に答える