がんや糖尿病、ぜんそくなど、多くの人々を悩ませる病気は、なぜこれほど複雑で、人によって効果のある治療法が異なるのでしょうか?その答えは、これらの病気がたった一つの遺伝子の異常ではなく、まるでオーケストラのように多数の遺伝子が複雑に絡み合って引き起こされる「複雑な疾患」であることにあります。この膨大で複雑な遺伝子の組み合わせの中から、病気の真の原因となっている「犯人グループ」を特定することは、これまで非常に困難な課題でした。しかし今、ノースウェスタン大学の研究者たちが、この難問を解決する画期的なAIツールを開発し、個別化医療への新たな道を切り拓こうとしています。

新ツールが多標的治療と個別化医療への道を拓く

ノースウェスタン大学の生物物理学者たちが、糖尿病、がん、ぜんそくといった複雑な疾患の根底にある遺伝子の組み合わせを特定するための新しい計算ツールを開発しました。単一遺伝子疾患とは異なり、これらの病状は複数の遺伝子が協調して働くネットワークによって影響を受けます。しかし、考えられる遺伝子の組み合わせの数は膨大で、研究者が病気を引き起こす特定の組み合わせを正確に突き止めることは、信じられないほど困難でした。

生成AIモデルを用いたこの新しい手法は、限られた遺伝子発現データを増幅させ、研究者が複雑な形質を引き起こす遺伝子活動のパターンを解明することを可能にします。この情報は、複数の遺伝子に関連する分子標的を含む、より新しく効果的な疾患治療法につながる可能性があります。この研究は、6月9日の週に学術雑誌「PNAS」に掲載されました。

「多くの病気は、単一の遺伝子だけでなく、遺伝子の組み合わせによって決まります」と、本研究の責任著者であるノースウェスタン大学のアジルソン・モッター博士(Adilson Motter, PhD)は語ります。「がんのような病気は、飛行機事故に例えることができます。ほとんどの場合、飛行機が墜落するためには複数の故障が起こる必要があり、異なる故障の組み合わせが同様の結果につながることがあります。このことが原因を特定する作業を複雑にしています。私たちのモデルは、主要な要因とその集団的な影響を特定することで、物事を単純化するのに役立ちます。」

複雑系の専門家であるモッター博士は、ノースウェスタン大学ワインバーグ芸術科学部のチャールズ・E・アンド・エマ・H・モリソン物理学教授であり、ネットワークダイナミクスセンターの所長も務めています。本研究の他の著者たち—全員がモッター博士の研究室に所属—は、ポスドク研究員のベンジャミン・クズネッツ=スペック博士(Benjamin Kuznets-Speck, PhD)、大学院生のブドゥカ・オゴナー氏(Buduka Ogonor)、そして研究員トーマス・ウィトック氏(Thomas Wytock)です。

 

既存の手法の限界

何十年もの間、研究者たちは複雑なヒトの形質や疾患の遺伝的基盤を解明するのに苦労してきました。身長、知能、髪の色といった非疾患性の形質でさえ、遺伝子の集合に依存しています。ゲノムワイド関連解析のような既存の手法は、形質に関連する個々の遺伝子を見つけようとしますが、遺伝子群の集団的な効果を検出するための統計的な検出力に欠けています。

「ヒトゲノム計画は、私たちが持つ遺伝子の数が単細胞のバクテリアのわずか6倍であることを示しました」とモッター博士は言います。「しかし、人間はバクテリアよりもはるかに洗練されており、遺伝子の数だけではそれを説明できません。このことは、多遺伝子間の関係が広く存在すること、そして複雑な生命現象を生み出しているのは遺伝子間の相互作用に違いないことを浮き彫りにしています。」

「単一の遺伝子を特定することも依然として価値があります」とウィトック氏は付け加えます。「しかし、単一遺伝子の変化によって説明できる観察可能な形質、すなわち表現型は、ごくわずかな割合に過ぎません。その代わりに、私たちは表現型が多くの遺伝子の協調作業の結果であることを知っています。したがって、通常は複数の遺伝子が一つの形質のバリエーションに寄与していると考えるのが理にかなっています。」

 

注目したのは遺伝子ではなく「遺伝子発現」

遺伝的構成(遺伝子型)と観察可能な形質(表現型)との間に長年存在する知識のギャップを埋めるため、研究チームは機械学習と最適化を組み合わせた洗練されたアプローチを開発しました。

トランスクリプトームワイド条件付き変分オートエンコーダと名付けられたこのモデルは、生成AIを活用して、ヒトの限られた遺伝子発現データからパターンを特定します。これにより、疾患状態と健康状態を模倣し、遺伝子発現の変化を表現型の変化と照合することができます。このモデルは、個々の遺伝子の影響を単独で調べるのではなく、複雑な形質が集団として出現する原因となる遺伝子のグループを特定します。そして、最適化のフレームワークを用いて、細胞の状態を健康から疾患へ、あるいはその逆へと移行させる可能性が最も高い特定の遺伝子変化を正確に突き止めます。

「私たちが着目しているのは遺伝子配列ではなく、遺伝子発現です」とウィトック氏は言います。「私たちは臨床試験のデータでモデルを訓練したので、どの発現プロファイルが健康で、どれが疾患状態であるかを知っています。より少数の遺伝子については、その遺伝子がオンまたはオフになったときにネットワークがどのように応答するかを示す実験データもあり、それを発現データと照合して疾患に関与する遺伝子を見つけることができます。」

遺伝子発現に焦点を当てることには複数の利点があります。第一に、患者のプライバシー問題を回避できます。個人の実際のDNA配列である遺伝子データは、本質的に個人に固有のものであり、健康、遺伝的素因、家族関係に関する非常に個人的な青写真を提供します。一方、発現データは、細胞活動の動的なスナップショットのようなものです。第二に、遺伝子発現データは、様々な機能を発揮するために遺伝子を「活性化」または「不活性化」させることができる環境要因を暗黙的に考慮に入れています。

「環境要因はDNAに影響を与えないかもしれませんが、遺伝子発現には間違いなく影響を与えます」とモッター博士は言います。「ですから、私たちのモデルには環境要因を間接的に考慮に入れるという利点があるのです。」

 

個別化治療への道

TWAVEの有効性を実証するため、チームはいくつかの複雑な疾患でテストを行いました。この手法は、既存の手法では見逃されていたものを含む、それらの疾患を引き起こした遺伝子の特定に成功しました。また、TWAVEは、異なる人々において、異なる遺伝子のセットが同じ複雑な疾患を引き起こしうることも明らかにしました。この発見は、患者の特定の遺伝的な疾患ドライバーに合わせて個別化治療を調整できる可能性を示唆しています。

「ある病気は、二人の異なる個人において同様に現れるかもしれません」とモッター博士は言います。「しかし、原理的には、遺伝的、環境的、そして生活習慣の違いにより、各個人で関与する遺伝子のセットが異なる可能性があります。この情報は、個別化治療の方向性を定めるのに役立つでしょう。」

本研究「Generative Prediction of Causal Gene Sets Responsible for Complex Traits(複雑な形質の原因となる遺伝子セットの生成的予測)」は、米国国立がん研究所、NSF-Simons国立生物学理論数理研究所、および米国科学財団からの支援を受けて行われました。

[News release] [PNAS]

この記事の続きは会員限定です