研究チームは、新しい視点として「タンパク質全体」ではなく「タンパク質ドメイン」(折りたたみや機能の単位)に注目しました。

そこでまずタンパク質の情報を収めたデータベースから、原核生物(細菌・古細菌)全体にわたって解析し、どのドメインがどの系統樹のどの位置で分岐していったかを追跡。

そのうえで、Archaea(古細菌)とBacteria(細菌)が分かれる前の祖先、すなわちLUCA(Last Universal Common Ancestor)の段階から存在していたドメインを選別しました。

これらの古いドメインをもつタンパク質を集めることで、LUCA時代のアミノ酸利用の傾向を解析。

さらに、それらをやや後期のドメイン(「post-LUCA」)と比較することで、「古い時代ほどどのアミノ酸が少ない・あるいは多かったか」を推定したのです。

結果として、LUCA由来のドメインは小さなアミノ酸を特に多く含み、一方で大きなアミノ酸は後から追加された可能性が高いことが示されました。

とくに、システインやメチオニン、ヒスチジンといった金属結合や硫黄系代謝に直結するアミノ酸は、従来のコンセンサスよりもかなり早い段階で組み込まれていた形跡が見られたのです。

これまでの研究でもグリシン(G)、アラニン(A)、バリン(V)、イソロイシン(I)、トレオニン(T)などは従来も“早期”に加わったとされていましたが、今回の解析でより強い裏付けが得られた形です。

もし遺伝コードとアミノ酸の対応が最初から完成されたものであった場合、このような時間のずれが起こることはあり得ません。

一方、グルタミン(Q)などは、非常に遅い段階(19番目)で追加された可能性が高いことが示唆されました。

これは従来の推定と大きく異なるポイントです。

特に衝撃的だったのは、メチオニン(M)、システイン(C)、ヒスチジン(H)といった、金属結合や硫黄を含むアミノ酸が“意外にも早期”にコードへ組み込まれていた可能性が示されたことです。