「DNAのデータ容量は750MB」との話を耳にした。
これは1対の塩基が2ビットのデータに相当すると仮定したときの概算値だ。ヒトゲノムは約30億個の塩基対で構成されているので、計60億ビット。1バイトは8ビットなので、約750MB、ということらしい。
個人的には、この計算は正しくないよね、と思っている。専門的な話なので細かく書けば煙たくなるが、実際にはもっと、ずっと多いはずだ。
2ビットで扱える情報は[00, 01, 10, 11]の4通りだ。DNAに含まれる塩基は、教科書的にはA(アデニン)、T(チミン)、G(グアニン)、C(シトシン)の4種類。だから1塩基対=2ビット、というのは分かりやすい。
だが、実際のDNAではさまざまな反応によって、C(シトシン)がU(ウラシル)に変わってしまったり、グアニンの構造が変わってしまったり、塩基自体がポロッと外れてしまったりする。となると、DNAが持つ情報はざっくり見積もってもギガバイトオーダーになるんじゃないだろうか。
DNAは組織ごとに異なる位置がRNAに転写され、そのRNAの塩基3つずつの組み合わせによってタンパク質を作るアミノ酸の種類が決まる。つまり、DNA自体が持つデータはコードですらないと言える。
こんな大きなデータをマウスですら(625MB:約25億塩基対)持っているのだから、生物っていうのは途方もないデータの塊のようだ。
ちなみに、最もゲノムが短いと言われる細菌「カルソネラ」では40KB(16万塩基対)の計算になる。テキストデータくらいの容量だと思うと、非常に単純な気がしてしまう。
今日の作業
先日行った姫路市の手柄山温室植物園にて開催されていた『エアプランツとその仲間展』についての記事を公開した。
思った以上に見どころが多く、チランジア好きにはたまらない展示だった。会期は2/18までなので、興味のある方はぜひ訪れてみて欲しいと思う。