すべての DNA を 1 つのストリームに保存するのではなく、ほとんどの場合、DNA は染色体ごとに保存されます。
大きな染色体は約 300 MB、小さな染色体は約 50 MB かかります。
編集:
塩基対あたり 2 ビットで保存されない最初の理由は、データを操作する上でハードルが発生するためだと思います。ほとんどの人は、それを変換する方法を知りません。また、変換用のプログラムが提供されたとしても、大企業や研究機関の多くの人々は、プログラムのインストール方法を尋ねることを許可されていない/要求する必要がないか、または知らない.
1GB のストレージは無料です。3 GB のダウンロードでも 100 Mbitsps で 4 分しかかからず、ほとんどの企業はより高速です。
もう 1 つのポイントは、データが言われるほど単純ではないということです。
たとえば、Craig_Venterによって発明されたシーケンシングの方法は大きなブレークスルーでしたが、欠点もあります。同じ塩基対の長鎖を分離することはできないため、A が 8 つあるのか 9 つあるのかが常に 100% 明確であるとは限りません。あとで気をつけないといけないこと…
もう 1 つの例は、DNA メチル化です。これは、この情報を 2 ビット表現で保存できないためです。