生命の設計図である遺伝子。そこに記された遺伝暗号は、生命が機能するための複雑なプロセスを指示しています。しかし、そもそもこの暗号は、いつ、どのようにして現在の形になったのでしょうか?この生命の根源的な謎に、イリノイ大学アーバナ・シャンペーン校の最新の研究が新たな光を当てています。その鍵は、驚くべきことに、タンパク質を構成する「アミノ酸2つのペア」に隠されていました。

この発見は、遺伝子工学やバイオインフォマティクスの分野にも貴重な洞察を与えるものです。2025年8月14日に『Journal of Molecular Biology』誌で発表されたオープンアクセス論文は、「Tracing the Origin of the Genetic Code and Thermostability to Dipeptide Sequences in Proteomes(プロテオーム中のジペプチド配列に遺伝暗号の起源と熱安定性を追跡する)」と題されています。著者には、ミンレイ・ワン氏(Minglei Wang)、M・ファイェズ・アジズ氏(M. Fayez Aziz)、そしてグスタボ・カエタノ=アノレス教授(Gustavo Caetano-Anollés)が含まれています。

「私たちは、遺伝暗号の起源が、生物内の全タンパク質の集合体であるプロテオームのジペプチド(アミノ酸2つのペア)構成と不思議な形でリンクしていることを見出しました」と、責任著者であるイリノイ大学のカエタノ=アノレス教授は述べています。

カエタノ=アノレス教授の研究は、生物のゲノム間の進化的関係を研究する系統ゲノミクス(Phylogenomics)に焦点を当てています。彼の研究チームは以前、タンパク質の構造単位であるドメインと、タンパク質合成中にアミノ酸をリボソームに運ぶRNA分子であるトランスファーRNA(tRNA: transfer RNA)の進化のタイムラインをマッピングする系統樹を構築しました。今回の研究では、彼らはジペプチド配列(ペプチド結合で結ばれた2つのアミノ酸からなる基本モジュール)の進化を探求し、ドメイン、tRNA、そしてジペプチドの歴史がすべて一致することを発見しました。

地球上の生命は38億年前に始まりましたが、遺伝子と遺伝暗号が出現したのは、それから8億年も後のことです。その起源については、いくつかの説が競合しています。

RNAベースの酵素活性が先だったと考える科学者もいれば、タンパク質が最初に協調して働き始めたと示唆する科学者もいます。カエタノ=アノレス教授と彼の同僚による過去数十年の研究は後者の見方を支持しており、リボソームタンパク質とtRNAの相互作用は進化のタイムラインの後半に現れたことを示しています。

生命は、互いに連携して機能する2つのコードで動いている、とカエタノ=アノレス教授は説明します。遺伝暗号は核酸(DNAとRNA)に情報を保存し、一方のタンパク質コードは酵素や他の分子に細胞を生かし、機能させ続ける方法を伝えます。この2つを橋渡しするのが、細胞のタンパク質工場であるリボソームで、tRNA分子によって運ばれてきたアミノ酸を組み立ててタンパク質を生成します。アミノ酸をtRNAに搭載する酵素は、アミノアシルtRNA合成酵素と呼ばれます。これらの合成酵素は遺伝暗号の守護者として機能し、すべてが適切に機能しているかを監視しています。

「なぜ生命は、遺伝子用とタンパク質用の2つの言語に依存しているのでしょうか?」とカエタノ=アノレス教授は問いかけます。「私たちはまだ、なぜこの二重システムが存在するのか、あるいは両者のつながりを何が駆動しているのかを知りません。その駆動力は、機能的に不器用なRNAにあるとは考えにくい。一方、タンパク質は、細胞の洗練された分子機械を操作する専門家です。」

プロテオームは、遺伝暗号の初期の歴史を保持するのにより適しているように見え、特にジペプチドはタンパク質の初期の構造モジュールとして重要な役割を果たしていました。ジペプチドの組み合わせは400通り考えられ、その存在量は生物によって異なります。

研究チームは、生命の3つの超界(古細菌、細菌、真核生物)を代表する1,561のプロテオームにわたる43億のジペプチド配列のデータセットを分析しました。彼らはその情報を用いて系統樹とジペプチド進化の年表を構築し、また、ジペプチドをタンパク質構造ドメインの樹にマッピングして、同様のパターンが現れるかどうかを確認しました。

以前の研究で、研究者たちはtRNAの系統を構築し、アミノ酸が遺伝暗号に組み込まれた時期のタイムラインを提供するのに役立て、出現時期に基づいてアミノ酸を3つのグループに分類していました。最も古いグループ1にはチロシン、セリン、ロイシンが含まれ、グループ2にはさらに8つのアミノ酸が含まれていました。これら2つのグループは、不正確なアミノ酸の搭載を修正する合成酵素における編集機能の起源と、各コドンが単一のアミノ酸に対応することを保証する最初の特異性のルールを確立した初期のオペレーショナルコードに関連していました。グループ3には、後に出現し、標準遺伝暗号に関連する派生的な機能と結びついたアミノ酸が含まれていました。

チームはすでに、アミノ酸の出現に関連した合成酵素とtRNAの共進化を実証していましたが、今回、その分析にジペプチドを加えることができました。

「私たちは、結果が一致していることを見出しました」とカエタノ=アノレス教授は説明します。「一致は系統解析における重要な概念です。これは、ある種のデータで得られた進化の記述が、別の種類のデータによって確認されることを意味します。このケースでは、タンパク質ドメイン、tRNA、ジペプチド配列という3つの情報源を検証しました。3つすべてが、特定のアミノ酸が特定の順序で遺伝暗号に追加されていく同じ進行を示したのです。」

もう一つの新しい発見は、ジペプチドペアの出現における二重性でした。各ジペプチドは、例えばアラニン-ロイシン(AL)のように2つのアミノ酸を組み合わせますが、その対称的なもの、つまりアンチジペプチドは、ロイシン-アラニン(LA)という逆の組み合わせを持ちます。ペアとなる2つのジペプチドは相補的であり、互いの鏡像と見なすことができます。

「私たちは系統樹において注目すべきことを発見しました」とカエタノ=アノレス教授は言います。「ほとんどのジペプチドとアンチジペプチドのペアは、進化のタイムライン上で非常に近い位置に現れたのです。この同時性は予期せぬものでした。この二重性は、遺伝暗号に関する根本的な何かを明らかにし、生物学に革新的な影響を与える可能性があります。それは、ジペプチドが核酸ゲノムの相補的な鎖にコードされて出現していたことを示唆しており、おそらくは原始的な合成酵素と相互作用した最小限のtRNAだったのでしょう。」

ジペプチドは任意に組み合わせとして生じたのではなく、タンパク質の折りたたみや機能を形作る重要な構造要素として出現しました。この研究は、ジペプチドが、初期のRNAベースのオペレーショナルコードと並行して、初期のタンパク質の構造的要求に応答して出現した原始的なタンパク質コードを表していることを示唆しています。このプロセスは、共進化、分子的編集、触媒作用、特異性によって形作られ、最終的に現代の遺伝暗号の守護者である合成酵素を生み出しました。

遺伝暗号の進化的ルーツを解明することは、生命の起源についての私たちの理解を深めるだけでなく、遺伝子工学、合成生物学、生物医学研究といった現代の分野にも情報を提供します。

「合成生物学は、進化的視点の価値を認識しつつあります。それは、自然に設計を導かせることで遺伝子工学を強化します。生物学的構成要素やプロセスの古さを理解することは、それらの回復力や変化への抵抗性を浮き彫りにするため重要です。意味のある改変を行うためには、遺伝暗号の制約と根底にある論理を理解することが不可欠です」とカエタノ=アノレス教授は述べました。

写真:グスタボ・カエタノ=アノレス教授(Gustavo Caetano-Anollés) (illustration by Fred Zwicky)

[News release] [Journal of Molecular Biology article]

この記事の続きは会員限定です