かつてヒトゲノム研究に革命をもたらした「1000ゲノムプロジェクト」。その完了から10年の時を経て、残された貴重なサンプルが最新技術の力で再び輝きを放ち始めました。これまで誰も見ることができなかった、ヒトの遺伝的バリエーションの全体像が、今、驚くほど鮮明に描き出されようとしています。この記事では、私たちの生命の設計図に隠された新たな物語を解き明かす、最先端の研究成果をご紹介します。

2003年に完了したヒトゲノム計画は、私たちに初めてのヒトゲノム配列をもたらしましたが、それはごく少数の人々のDNAに基づいたものでした。この成功を礎に、2007年に1000ゲノムプロジェクトが構想されました。このプロジェクトは、1,000人のヒトゲノムを解読するという野心的な目標から始まり、それを超える成果を上げ、2015年には様々な祖先を持つ2,500人以上の個人のデータを発表しました。これらのプロジェクトは、私たち一人ひとりをユニークにし、生命活動の基盤となる遺伝学に関する知識の多くに貢献してきました。そして今、10年の時を経て、欧州分子生物学研究所(EMBL)の科学者とその共同研究者たちは、10年前には利用できなかった手法や技術を駆使して、この膨大なリソースのサンプルをより深く分析し、ヒト生物学に関する新たな知見を明らかにしました。2025年7月23日に科学雑誌『Nature』で連続して発表された2つの論文で共有されたデータセットは、今日における最も完全なヒトゲノムの全体像と言えるかもしれません。

EMBLハイデルベルクのグループリーダー兼暫定責任者であり、今回の新しい研究の共同シニアオーサーであるヤン・コーベル氏(Jan Korbel)は次のように述べています。「約15年前、ほとんどのヒトゲノムシーケンシングは、DNAの短い断片からの『リード』に依存していました。これはゲノム全体を繋ぎ合わせるには不十分でしたが、ゲノムの大部分における遺伝的バリエーションの研究を可能にするには十分でした。しかし、約5年前から、はるかに長いDNA断片を解読できる新しい市販技術でヒトゲノムを日常的にシーケンシングすることが可能になり、個人のゲノム全体を組み立て、ゲノムのあらゆる部分の遺伝的バリエーションを評価できるようになりました。」

これらの技術は総称してロングリードシーケンシング法として知られており、EMBLの科学者たちは、がんの発生や環境研究の理解を深めるためにこれらの技術を使用してきました。「私たちは、これらの新しい革新的なシーケンシング技術の力を活用して、ヒトの遺伝的バリエーションについてさらに学びたいと考えていました」とコーベル氏は語ります。

遺伝的バリエーション(個々のDNA配列の違い)は、私たち一人ひとりをユニークにし、健康や疾患において重要な役割を果たしています。このようなバリエーションは、遺伝暗号の1つまたは数個の「文字」における小さな違いの形をとることもあれば、特定の個人においてDNAの長い配列全体が欠失、逆位、反復、または付加されるといった、はるかに大きなものである場合もあります。

現在では、このような「構造的」バリエーションが一般的であるだけでなく、がんを含む多くの遺伝性疾患において主要な役割を果たしていることが知られています。ヒトゲノム全体におけるこのようなバリエーションの「マップ」は、疾患の状態で何が問題になっているのかを理解するための基準として役立つため、臨床的にも非常に関連性が高いものです。

今回の2つの新しい研究では、ロングリードシーケンシング技術を用いて、ゲノム全体のこのような構造的バリエーションをより深く掘り下げています。両研究において、コーベル氏のグループは、ゲノムデータサイエンスの専門家で構成されるドイツのハインリッヒ・ハイネ大学デュッセルドルフのトビアス・マルシャル氏(Tobias Marschall)の研究室と協力しました。

 

ヒトパンゲノムの強化

最初の研究では、5大陸26集団にわたる1000ゲノムプロジェクトのデータセットから1,019のゲノムを調査しました。研究者たちは、ロングリードシーケンシング法を用い、オーストリアの分子病理学研究所(IMP)ウィーンのジークフリート・シュロイスニッヒ氏(Siegfried Schloissnig)と協力して、これらの個人のゲノム全体にわたる構造的バリエーションの詳細なマップを作成しました。この新しい情報により、彼らは新たな生物学的知識を生み出すだけでなく、2023年にヒトパンゲノム参照プロジェクトによって発表された44ゲノムの参照グラフを20倍以上に拡張することができました。このオープンアクセス論文のタイトルは、「Structural Variation in 1,019 Diverse Humans Based On Long-Read Sequencing(ロングリードシーケンシングに基づく1,019人の多様なヒトにおける構造多様性)」です。

この研究のために、研究者たちはEMBL-EBI(欧州バイオインフォマティクス研究所)のユーワン・バーニー氏(Ewan Birney)のチームとサラ・ハント氏(Sarah Hunt)、そしてスペインのゲノム制御センター(CRG)のベルナルド・ロドリゲス・マルティン氏(Bernardo Rodríguez Martín)らとも協力しました。

「オリジナルの1000ゲノムプロジェクトは、ヒト集団内で変動するゲノム上の位置のマップを作成し、これにより一般的な疾患に関連する領域を体系的に検索することが可能になりました」とハント氏は言います。「その最初のマップは短いバリアントから構築されましたが、私たちはすでに長いバリアントが疾患に関連するケースを知っています。この研究による新しいマップは、これまでに作成された他の構造的バリアントマップよりも精密で詳細であり、新たな疾患との関連性を探求することを可能にするでしょう。」

2番目の研究では、わずか65人の個人というはるかに小さなサンプルセットを使用しましたが、いくつかの強力なシーケンシング法を組み合わせて、これまでにシーケンスされた中で最も完全なゲノムを構築しました。いくつかの染色体については、研究者たちは端から端までの配列を組み立てました。これは、ヒトの染色体が数億塩基対(つまり「文字」)の長さになり得ることを考えると、驚くべき偉業です。この研究は、ヒトゲノム構造多様性コンソーシアムの一部を形成する米国のいくつかの主要な研究所の研究者と共同で実施されました。このオープンアクセス論文のタイトルは、「Complex Genetic Variation in Nearly Complete Human Genomes(ほぼ完全なヒトゲノムにおける複雑な遺伝的多様性)」です。

「ヒトゲノム構造多様性コンソーシアムは、様々な技術やゲノム領域の専門家を集め、発見を推進するための国際協力の力を示しています」とハント氏は述べました。「この研究は、これまで見ることのできなかったゲノムの部分に光を当てることで新たな生物学的洞察を明らかにし、さらなるゲノム解析のためのツールキットを作成しました。」

コーベル氏は、これらの研究が互いに強く補完し合っていると考えています。「一方の研究はシーケンシングのパワーは少ないですが、はるかに大きな集団を対象としています。もう一方は集団は小さいですが、サンプルあたりのシーケンシングパワーがはるかに大きいです。これにより、相補的な結論が導き出されました。」

このような完全なデータセットは、疾患における遺伝的バリエーションを特定し、確認するための基準となるため、臨床的に非常に重要です。追加の実験で、研究者たちは1,019ゲノムのより大きなデータセットを基準として使用することで、疾患関連バリアントを特定する精度が従来の方法と比較して大幅に向上することを示しました。

これらのデータセットは、興味深い新たな生物学的洞察ももたらしました。例えば、1,019サンプルの研究は、トランスポゾン(「動く遺伝子」とも呼ばれる)がDNA断片をゲノム内の新しい場所に移動させるのを助け、新しいバリアントを生み出す新しいメカニズムを解明するのに役立ちました。

一方、65ゲノムのデータセットは、科学者が従来の方法では研究が非常に困難だったゲノムの特定の部分(セントロメアなど)を理解するのに役立ちました。セントロメアは、細胞分裂時に染色体の2本の鎖が互いに付着する場所(よく知られたX字型を形成)であり、その異常は免疫疾患やがんを含む多くの疾患と関連付けられています。

「これら2つの研究は、ヒトゲノムの形成における反復DNAの重要な役割を浮き彫りにし、その反復的で複雑な性質のために以前の参照データセットではほとんど見過ごされていた領域内に、遺伝的バリエーションの宝庫を発見しました」と、かつてコーベル氏のグループのメンバーで、現在はCRGのグループリーダーであり、研究の1つの共同シニアオーサーであるロドリゲス・マルティン氏は述べています。

 

ゲノム生物学者のための新しいリソース

新しいデータセットは、世界中の研究者が分析・利用できるように公開されています。これらの研究はまた、科学者たちが以前の研究で試みられたよりもはるかに大規模なデータを分析するために作成した、新しいゲノム解析法という形での革新も促しました。

「これらの研究を通じて、私たちは包括的で医学的に関連性の高いリソースを作成しました。これは現在、世界中の研究者がヒトゲノムのバリエーションの起源をよりよく理解し、それが様々な要因によってどのように影響を受けるかを見るために利用できます」と、ハインリッヒ・ハイネ大学デュッセルドルフの教授であり、両研究の共同シニアオーサーであるマルシャル氏は述べています。「これは、ゲノム科学の新たな展望を開く共同研究の素晴らしい例であり、より完全なヒトパンゲノムへの一歩です。」

[News release] [Nature article 1019] [Nature article 65]

この記事の続きは会員限定です