私たち人間を含む複雑な生物の祖先、「真核細胞」はどのようにして生まれたのでしょうか?この生命進化における最大のジャンプは、長年「生物学の中心にあるブラックホール」と呼ばれ、大きな謎に包まれてきました。しかし今、物理学の「相転移」という概念を武器に、その誕生の瞬間に光を当てる画期的な研究が登場しました。生命の複雑化への扉を開いたカギは、遺伝子の「長さ」に隠されていたのです。
生命進化のブラックホールに挑む
マインツ、バレンシア、マドリード、チューリッヒの4人の上級科学者による国際共同研究チームは、2025年3月27日に学術誌『PNAS』にて、地球上の生命の進化の歴史において最も重要な複雑化である真核細胞の起源に光を当てる、画期的な研究を発表しました。このオープンアクセスの論文は、「The Emergence of Eukaryotes As an Evolutionary Algorithmic Phase Transition(進化的アルゴリズム相転移としての真核生物の出現)」と題されています。
真核細胞は、古細菌と細菌の融合によって生まれたという細胞内共生説が広く受け入れられていますが、その融合から真核細胞が出現するまでの数十億年間、進化の系統樹には中間的な生物が見当たらず、私たちの知識には大きな空白期間が存在します。これが「生物学の中心にあるブラックホール」と呼ばれる所以です。「この新しい研究は、理論的アプローチと観察的アプローチを融合させ、生命の遺伝的構造がどのようにしてこれほどの複雑性の増大を可能にしたのかを、定量的に理解するものです」と、本プロジェクトでヨハネス・グーテンベルク大学マインツ(JGU)を代表するエンリケ・M・ムロ博士(Enrique M. Muro, PhD)は述べています。
遺伝子とタンパク質の長さが語る進化の物語
『PNAS』誌の論文は、9,913種のプロテオーム(タンパク質全情報)と33,627種のゲノムを分析し、生命の系統樹全体にわたって、タンパク質の長さとそれに対応する遺伝子の長さの分布が対数正規分布に従うことを示しました。対数正規分布は通常、乗算的なプロセス(前の状態に何かを掛け合わせて次の状態が決まるプロセス)の結果として生じます。研究者たちは、オッカムの剃刀の原則に従い、遺伝子長の分布の進化を乗算的な確率過程としてモデル化しました。
研究チームは、3つのドメイン(細菌、古細菌、真核生物)の起源とされる**LUCA(全生物最終共通祖先)**から出発し、平均遺伝子長が進化の時間を経て指数関数的に増大してきたことを、理論と観察の両面から発見しました。さらに、平均タンパク質長に分散が直接依存するという、系統樹全体に共通するスケーリング不変な遺伝子成長メカニズムを発見しました。これにより、平均遺伝子長が生物の複雑性を示す非常に良い代理指標であることを証明したのです。マドリード工科大学のバルトロ・ルケ博士(Bartolo Luque, PhD)は、「ある種のタンパク質をコードする遺伝子の平均長を知ることで、その種内の遺伝子長の全分布を計算できるのです」と付け加えました。
原核生物では遺伝子に非コード配列がほとんどないため、タンパク質と遺伝子の平均長は同時に進化していきます。しかし、平均遺伝子長が1,500ヌクレオチドに達すると、タンパク質は遺伝子の成長プロセスから切り離され、その平均長は真核細胞の出現後、約500アミノ酸で安定化するという明確な閾値が見られました。これこそが真核細胞の出現を示すしるしです。その時点から、タンパク質とは異なり、遺伝子の平均長は非コード配列の存在によって、原核生物の時と同じように増え続けていきました。
アルゴリズム的相転移:生命の複雑化が起きた瞬間
臨界現象の分析から、磁性材料の物理学でよく研究されている「相転移」が、臨界遺伝子長1,500ヌクレオチドで起こったと結論付けられました。これが真核細胞の誕生を示し、生命の進化を「コード化相(原核生物)」と「非コード化相(真核生物)」という2つの明確な段階に分けます。さらに、この転移点周辺では、システムのダイナミクスが多くの準安定状態に捉えられる「臨界減速」のような、相転移に特徴的な現象も観察されました。「この現象は、初期の原生生物や菌類で裏付けられています」とバレンシア大学のフェルナンド・バジェステロス博士(Fernando Ballesteros, PhD)は言います。
さらに、「この相転移はアルゴリズム的でした」とチューリッヒ大学のジョルディ・バスコンプテ教授(Jordi Bascompte)は付け加えます。LUCAに近い短いタンパク質の時代では、タンパク質と遺伝子を長くすることは計算的に単純でした。しかし、タンパク質が長くなるにつれて、さらに長いタンパク質を探し出すことは実行不可能になりました。遺伝子は以前と同じ速度で成長する一方でタンパク質は成長できないというこの緊張は、非コード配列を遺伝子に組み込むことで、連続的かつ突如として解決されました。この革新により、新しいタンパク質を探索するアルゴリズムの計算複雑性は劇的に低下し、スプライソソームと核(転写・スプライシングと翻訳を分離した)の登場によって非線形になったのです。この相転移の臨界点は、本研究により26億年前と推定されています。
この研究は、計算生物学、進化生物学、物理学を組み合わせた学際的なものであり、生命の進化における最も重要な複雑性の増大であった真核細胞が相転移として出現し、多細胞化、有性生殖、社会性といった、今日の地球上の生命を形作った他の主要な進化への道を開いたことを示しています。
