ハフマンおよび適応形ハフマンアルゴリズムではなく、圧縮技術を使用してDNAシーケンスを圧縮したいのですが、プログラミング言語としてc#を使用しています。誰かが私をアルゴリズムに導くことができますか?注:可逆圧縮が必要です
1 に答える
6
DNA配列を使用すると、4つの可能な状態があります。
- グアニン(G、00)
- シトシン(C、01)
- アデニン(A、10)
- チミン(T、11)
2ビットを使用して、値を角かっこで囲んだ4つの可能な状態を格納できます。この単純な方法を使用すると、1バイトに4つの異なる値を格納できます。
更新
@kolが述べたように、データをさらに縮小するために、実質的に任意の圧縮アルゴリズムを使用できます。現在、.NETには2つの圧縮方法(DeflateとGZip)が付属しており、SharpZipLibオープンソースライブラリにはさらに多くの方法があります。
于 2011-12-19T18:16:56.463 に答える