2022年7月28日、「タンパク質の宇宙をまるごと:AIがほぼすべての既知のタンパク質の形状を予測 - DeepMind社のAlphaFold ツールは約2億個のタンパク質の構造を決定した。(The Entire Protein Universe: AI Predicts Shape of Nearly Every Known Protein–DeepMind’s AlphaFold Tool Has Determined the Structures of Around 200 Million Proteins.)」と題された画期的な一歩を記した論文がNature誌に掲載された。この偉大な成果を受け、DeepMindのCEO兼共同創業者のデミス・ハサビス博士は、ニュースリリースで次のように書いている。
DeepMind CEOが語る、記念すべき偉業
我々が1次元のアミノ酸配列からタンパク質の立体構造を予測するAIシステム「AlphaFold」を公開・オープンソース化し、この科学的知識を世界に自由に発信する「AlphaFoldタンパク質構造データベース(AlphaFold DB)」を構築してから、1年が経った。
タンパク質は生命の構成要素であり、あらゆる生物のあらゆる生物学的プロセスを支えている。そして、タンパク質の形はその機能と密接に関係しているため、タンパク質の構造を知ることで、その機能と仕組みがより深く理解できるようになる。我々は、この画期的なリソースが科学的研究と発見を世界的に加速させ、他のチームがAlphaFoldの進歩から学び、それを基にさらなるブレイクスルーを生み出すことを期待した。その願いは、我々が夢見たよりもずっと早く現実のものとなった。それからわずか12ヶ月で、AlphaFoldは50万人以上の研究者に利用され、プラスチック汚染から抗生物質耐性に至るまで、現実世界の重要な問題の進展を加速させるために利用されている。
今日(7月28日)、私はこの旅の次の段階を共有できることを大変嬉しく思っている。EMBLのヨーロッパバイオインフォマティクス研究所(EMBL-EBI)との協力により、我々は現在、科学的に知られているほぼすべてのカタログ化されたタンパク質の予測構造をリリースしている。
今回のアップデートでは、植物、バクテリア、動物、その他の生物のタンパク質の予測構造が含まれており、研究者がAlphaFoldを使って、持続可能性、食糧不安、顧みられない病気などの重要な問題に対する研究を進めるための新しい機会が開かれた。
本日のアップデートにより、主要なタンパク質データベースであるUniProtのほとんどのページで、予測された構造が表示されるようになる。また、2億以上のすべての構造がGoogle Cloud Public Datasetsから一括ダウンロードできるようになり、世界中の科学者がAlphaFoldにさらにアクセスしやすくなる。
エリック・トポル医学博士「重大な進歩」についてコメント
スクリプス研究トランスレーショナル研究所の創設者兼所長であるエリック・トポル医学博士は、次のようにコメントしている。「AlphaFoldは、ライフサイエンスにおいて、AIの力を示す唯一かつ重大な進歩だ。タンパク質の立体構造を決定するのに何ヶ月も何年もかかっていたのが、今では数秒でできるようになった。AlphaFoldは、核膜複合体の構造を解明するなど、すでに大きな発見を加速し、可能にしている。そして今回、タンパク質のほぼ全宇宙を照らす構造が新たに加わったことで、日々、より多くの生物学的ミステリーが解明されていくことだろう。」
AlphaFoldのこれまでの影響
我々のチームにとって、AlphaFoldの成功は特にやりがいのあるものだった。なぜなら、このシステムは我々がこれまでに作った中で最も複雑で、複数の重要な技術革新を必要とし、また、下流に最も大きな影響を及ぼしたものだったからだ。AlphaFoldは、AIが原子レベルの精度でタンパク質の形状を正確に予測できることを、大規模かつ数分で実証した。これは50年にわたる壮大な課題に対するソリューションを提供しただけでなく、『人工知能は科学の発見を劇的に促進し、ひいては人類の発展をもたらす』という当社の創業理念を証明する最初の大きなポイントになったのだ。
AlphaFoldの最初のリリースから12ヶ月が経ち、AlphaFoldがすでに与えた驚くべき影響と、今日のマイルストーンに到達するまでの我々の長い道のりを振り返ることは、素晴らしいことだ。
我々はAlphaFoldのコードをオープンソース化し、2つの詳細な論文をNature誌に発表した。この論文はすでに4,000回以上引用されている。我々は、世界をリードするEMBL-EBIと緊密に協力し、生物学者がAlphaFoldにアクセスし利用するのに最適なツールを設計し、誰でも無料で利用できる検索可能なデータベース、AlphaFold DBを共にリリースした。AlphaFoldをリリースする前に、責任を持って開拓するという我々の慎重な姿勢に沿って、我々は生物学研究、セキュリティ、倫理、安全などの分野の30人以上の専門家に意見を求め、AlphaFoldのメリットを最大限に生かし、潜在リスクを最小限に抑える方法で、世界と共有する方法を理解するために協力をしてもらった。
現在までに、190カ国から50万人以上の研究者がAlphaFold DBにアクセスし、200万を超える構造を閲覧している。また、我々の自由に利用できる構造は、Ensembl、UniProt、OpenTargetsといった他の公共データセットにも統合されており、何百万人ものユーザーが日常のワークフローの一部としてアクセスしている。
我々は、AlphaFoldがすでに世界中の研究所や大学の何十万人もの科学者にとって、彼らの重要な仕事を助けるために不可欠なツールとなっているスピードに驚きを感じている。我々自身のAlphaFoldの取り組みとしては、歴史的に資金が不足していたり、見過ごされてきた取り組みに焦点を当て、最もポジティブな社会的利益をもたらすと思われるアプリケーションを優先的に選んだ。例えば、Drugs for Neglected Diseases Initiative(DNDI)と提携し、リーシュマニア症やシャーガス病など、世界の貧しい地域に住む人々が不当に苦しんでいる病気に対する救命治療法の発見に向け、彼らの研究を促進させるための支援を行った。また、世界保健機関(WHO)が研究の優先順位を高くしている生物について構造予測を行い、「世界顧みられない熱帯病デー」を支援した。これは、ハンセン病や住血吸虫症など、世界で10億人以上の人々の生活を破壊している病気の研究を促進するためのものだ。
病気の理解からミツバチの保護、生物学的パズルの解読、生命の起源への深い考察まで、研究コミュニティがAlphaFoldを活用する方法は無数にあり、とても感動的だ。
AlphaFoldチームのメンバーが選んだ、その他の印象的な事例は以下の通りだ。
キャサリン・トゥニヤスヴナクール氏が選んだのは「生物学的ジグソーパズル」
最近のScience誌の特集号で、いくつかのグループが、生物学で最も厄介なパズルの一つである核膜孔複合体を組み立てるのに、AlphaFoldがどのように役立ったかを紹介している。この巨大な構造は、何百ものタンパク質部分から成り、細胞核に出入りするものすべてを制御している。その繊細な構造は、既存の実験手法でその輪郭を明らかにし、AlphaFold予測で不明な部分を補完して解釈することで、ようやく明らかになった。この強力な組み合わせは、現在研究室で日常的に行われており、新しい科学を解き明かし、実験と計算技術がいかにうまく連携できるかを示している。
Solving the Nuclear Pore Puzzle
リチャード・エバンス氏が選んだのは「バイオインフォマティクスの新世界」
Foldseek や Dali のような構造検索ツールにより、ユーザーは与えられたタンパク質に類似したエントリーを非常に迅速に検索することができる。これは、プラスチックを分解するタンパク質など、実用的に有用なタンパク質の大規模な配列データセットをマイニングするための第一歩となり、タンパク質の機能に関する手がかりを得ることができるかもしれない。AlphaFoldデータベースがアップデートされ、2億以上の予測された構造が含まれるようになったことで、このインパクトはさらに増幅されるだろう。
ジョン・ジャンパー氏が選んだのは「人の健康に直接影響するもの」
AlphaFoldは、すでに人々の健康に直接大きな影響を及ぼしている。ヨーロッパ人類遺伝学会の研究者たちと会うと、稀な遺伝病の原因を解明しようとする生物学者や臨床医にとって、AlphaFoldの構造がいかに重要であるかが分かる。さらに、創薬のターゲットとなり得るタンパク質が新たに同定され、それに結合する医薬品をより迅速に見つけることができるようになったことで、アルファフォールドは創薬を加速している。
ROME Therapeutics社 CEO、ロサナ・シャペル氏のコメント
ROME Therapeuticsの社長兼CEOであり、Nimbus Therapeuticsの前CSOであるロサナ・シャペル氏は、次のようにコメントしている。「AlphaFoldは一夜にしてバイオファーマの研究に欠かせないツールとなった。ここROME Therapeuticsでも、これまで解明されなかったダークゲノムの領域におけるタンパク質構造を予測することができるようになった。AlphaFoldのスピードと精度は創薬プロセスを加速しており、我々は新薬をより早く患者に届けるためにその効果を実感している。」
始まりに過ぎない
AlphaFoldは、生物学を構造的な豊かさの時代へと導き、科学的な探求をデジタルスピードで解き放った。AlphaFold DBは、タンパク質構造の「Google検索」の役割を果たし、研究者は研究中のタンパク質の予測モデルに即座にアクセスできるため、研究に集中し、実験作業を迅速化することができるようになる。
病気との闘いからワクチン開発まで、AlphaFoldはすでに我々の最大のグローバルな課題のいくつかに驚くべき進歩を可能にしているし、これは今後数年間で見られるようになる影響の始まりに過ぎない。我々の願いは、この拡張されたデータベースが、数え切れないほど多くの科学者の仕事を助け、メタプロテオミクスなど、まったく新しい科学的探求の道を開くことだ。
DeepMindでは、多くの分野で大規模な投資を行い、このようなすべての可能性を構築するために懸命に取り組んでいる。たとえば、Alphabetの新しい姉妹会社Isomorphic Labsと提携して、AI優先のアプローチで創薬プロセス全体を第一原理から再構築している。AIと実験技術の連携を強化し、タンパク質設計やゲノミクスなど生物学の理解を深めるために、有名なフランシス・クリック研究所にウェットラボを設立する。また、AI for Scienceチームを拡大し、生物学の基礎研究の進展を加速させ、気候科学、量子化学、核融合など、魅力的で重要な他の科学的課題にもAIを適用する。
AlphaFoldは、計算機とAIの手法を生物学に応用することで何が可能になるのか、未来を垣間見ることができるのだ。生物学はその最も基本的なレベルでは、非常に複雑で創発的であるとはいえ、情報処理システムであると考えることができる。物理学にとって数学が完璧な記述言語であるように、生物学の動的複雑性に対処するためには、AIがまさにうってつけの技術であることが分かると思う。AlphaFoldは、その重要な最初の実証例であり、今後さらに多くのことが起こる兆しでもあるのだ。
デジタルバイオロジーという新しい分野のパイオニアとして、我々はAIの大きな可能性が、科学的発見と生命の基本的メカニズムの理解のために、人類にとって最も有用なツールの一つとして実現し始めたことを嬉しく思っている。
[DeepMind release] [DeepMind] [Nature News article] [NY Times article]



