言ってみれば、DNAはタンパク質という生命活動の主役を作るための設計図のようなものです。
しかし、このDNAの設計図にはちょっと不思議な特徴があります。
それは、20種類のアミノ酸しか使っていないのに、なぜかアミノ酸を指定するコドン(指定札)は64通りも用意されていることです。
アミノ酸は20種類だけなのに、コドンは64通りもあるということは、当然、余分なコドンが生まれます。
(※理論上は20種類のアミノ酸に対してそれぞれ1つのコドンが対応する20通りに加えて、開始と終わりを示すコドンをプラスして22通りまで圧縮できると考えられています。)
実際、ほとんどのアミノ酸は1つだけのコドンではなく、複数のコドンを持っています。
例えば「セリン」というアミノ酸は、なんと6通りのコドンで表現できます。
これは同じ意味を持つ言葉がたくさんあるのと似ています。
挨拶をするときに「おはよう、こんにちは、こんばんわ」や「やあ」「おはよう」「どうも」など、いろんな表現があるような状態です。
こうした余分なコードのことを「冗長性」と言いますが、なぜ生命はこれほど重複だらけの言葉遣いをするようになったのでしょうか?
実は、この余分に見えるコード(コドン)を整理して、もっとシンプルなものにできないか、というアイデアは以前から注目されていました。
再び言語を例に出せば、日本語の挨拶を全て「こんにちは」にするようにある種の圧縮を行うわけです。
「おはよう」や「こんばんわ」や「やあ」「どうも」などを全て抹消して「挨拶=こんにちは」以外に認めないような圧縮・統一を、全単語に行えば、言語は非常にシンプルになります。
生命も同様で冗長なコードを減らせれば、生命の仕組みをシンプルに理解できるだけでなく、重要な実用的メリットが生まれるからです。
その一つが、ウイルスに感染しにくい細胞をつくることです。
ウイルス(特に細菌に感染するバクテリオファージ)は、自分だけでは増殖できません。