まるで壮大な合唱団のように、私たちの体中の細胞は完璧なハーモニーを奏でることで健康を維持しています。しかし、もし一部の細胞が「音を外して」しまったら、そのハーモニーは乱れ、体全体に広範な影響を及ぼしかねません。科学者たちは、この不協和音を奏でる細胞を特定することで、それらを再び調和させ、健康を取り戻す方法を学べるかもしれません。この音楽的な比喩から着想を得て、グラッドストーン研究所の研究チームは、「音を外した」細胞の検出を改善できる「CHOIR」という画期的な計算ツールを発表しました。CHOIR(choir: cluster hierarchy optimization by iterative random forestsの略)は、何千、何百万もの細胞を生物学的に異なるグループに分類し、病気の原因となりうる特定の細胞タイプや状態の特定を助けます。

「CHOIRが素晴らしいのは、既存のツールが抱える重要な限界のいくつかを解決してくれる点です」と語るのは、グラッドストーン研究所の研究員であり、2025年4月7日に『Nature Genetics』誌でCHOIRを発表した新しい研究の責任著者であるライアン・コーセス博士(Ryan Corces, PhD)です。「CHOIRは希少な細胞タイプをより正確に特定できるだけでなく、他のツールが陥りがちな、実際には生物学的に区別できない細胞タイプを『幻視』してしまう傾向も回避できます」。この論文は、「CHOIR Improves Significance-Based Detection of Cell Types and States from Single-Cell Data(CHOIRはシングルセルデータからの細胞タイプと状態の有意性に基づく検出を改善する)」と題されています。

「この新しいツールを使えば、これまで見過ごされてきたかもしれない、健康や病気を促進する細胞を正確に特定できます」と、グラッドストーン神経疾患研究所の所長であり、本研究の共著者でもあるレナート・ムッケ博士(Lennart Mucke, MD)は付け加えます。「この深い洞察により、私たちは最も有望なターゲットに研究や治療的介入を集中させることができるのです」。

 

生物学的な真実への到達

CHOIRは、研究現場の必要性から生まれました。現在グラッドストーン研究所の博士研究員であるキャスリン・サント博士(Cathrine Sant, PhD)は、ムッケ博士の研究室の大学院生だった時にこのプロジェクトに着手しました。

当時、彼女はアルツハイマー病を研究しており、シングルセルシーケンシング技術によって生成されるデータの解析方法を学んでいました。このような手法は、特定の組織サンプル中の細胞が持つ固有の生物学的アイデンティティや状態を捉えることができます。例えば、どの遺伝子がオンまたはオフになっているか、あるいはどのタンパク質が細胞表面に存在するかなどを明らかにします。

サント博士は、アルツハイマー病に関与している可能性のあるさまざまな細胞タイプや状態を探求したいと考えていました。そのためには、シングルセルデータを解析し、合唱団の歌手がソプラノ、アルト、バリトンにグループ分けされるように、細胞を生物学的に異なるクラスターに分類する統計的手法が必要でした。

彼女は、自身のプロジェクト向けに設計されたさまざまな既存のツールを検討しましたが、どれも完全にしっくりくるものはありませんでした。

「いくつかのツールでは、科学者が恣意的な判断を下す必要があり、その判断が個人的なバイアスを導入したり、既存の生物学的知識に縛られたりすることで、新たな発見の可能性を狭めてしまうことに衝撃を受けました」と、CHOIRの開発を主導し、今回の新しい研究の筆頭著者であるサント博士は語ります。「データセットの中にある生物学的な真実に迫るというよりは、まるで自分で結末を選ぶゲームブック(choose-your-own-adventure)のように感じられました」。

そこで、サント博士はその真実を明らかにするためのより良い方法を探し始めました。彼女は、グラッドストーン研究所で自身の研究室を立ち上げたばかりだったコーセス博士に協力を求め、彼の計算手法に関する専門知識を活用する一方、ムッケ博士の神経変性疾患に関する広範な知識も取り入れました。

共同で、科学者たちは直感ではなく、バイアスのない統計的フレームワークに依存する、ユーザーフレンドリーな手法を開発しました。その結果がCHOIRです。これは無償で利用可能なツールであり、ヒトや実験モデルのさまざまな組織タイプに適用して、生物学的に意味のある細胞のグループや状態を特定することができます。 

「約1年前に予備的な形式でオンライン公開して以来、何百人もの人々がCHOIRをダウンロードしてくれました」とサント博士は言います。「神経科学や免疫学、さらには心血管研究やがん研究など、多様な分野の科学者たちがすでにこのツールを創造的な方法で活用しているのを見るのは、非常に喜ばしいことです」。

CHOIRは、一般的な細胞タイプをまとまりのあるクラスターにグループ化する一方で、希少な細胞集団も正確に特定することに長けています。

 

重要なガードレール機能を備えたツール

 CHOIRの設計における重要な要素として、科学者がRNA、DNA、タンパク質に焦点を当てたものを含む、あらゆるシングルセル解析手法で生成されたデータに対して使用できる機械学習手法が組み込まれています。 

また、CHOIRには他のツールの落とし穴を避けるためのガードレール機能が組み込まれています。例えば、生物学的に異なる細胞タイプが誤って一緒にグループ化されてしまう「過小クラスタリング」を防ぎ、実際には異ならない細胞タイプを別個のものとして識別し、研究者を無駄骨を折るような探索に導いてしまう「過大クラスタリング」も防止します。 

さらに、異なる細胞タイプが同じようなサイズのクラスターで出現すると仮定する他のツールとは異なり、CHOIRは体内で実際に起こっていることを考慮に入れています。体内は、豊富なものから希少なものまで、さまざまなサイズの細胞集団で構成されています。 

「CHOIRは、一般的な細胞タイプを大きくまとまりのあるクラスターにグループ化する一方で、『干し草の山から針を探す』ような希少な細胞集団を同時に特定することに長けています」とサント博士は言います。

これらの特徴が組み合わさることで、CHOIRは病気の診断、治療、予防に重要となりうる細胞タイプや状態を、信頼性高く検出し、発見することができるのです。

 

CHOIR、ステージへ

CHOIRの実力を証明するため、サント博士らは脳、血液、がん細胞など、さまざまな生体サンプルや、複数のデータタイプを組み合わせたものを含む、多岐にわたるシングルセルデータタイプでテストを行いました。他のシングルセルデータ解析ツールと競わせたところ、CHOIRは最も人気のある15のツールを上回り、他のツールが見逃した異なる細胞タイプを特定しました。

「どの組織タイプでテストしても、CHOIRはデフォルト設定を微調整することなく、他の手法よりも優れた性能を示しました」とコーセス博士は述べます。「研究者が個人の直感に基づいて設定を微調整する必要がある場合に生じうるバイアスを、このデフォルト設定に頼ることで回避できます。これは、標準化を確保し、研究結果が研究室間で厳密かつ再現性のあるものであることを保証するために非常に重要です」。 

現在、CHOIRを手に、サント博士はアルツハイマー病研究に新たなアプローチで取り組んでいます。彼女と同僚たちはこのツールを使い、タウタンパク質のレベルを減少させた後の特定の脳細胞タイプに焦点を当てています。これは、この病気の潜在的な治療法として研究されている戦略です。彼らはまた、ヒト組織サンプルから得られた数百万個の細胞のシングルセルデータを含むアルツハイマー病データセットの解析にもCHOIRを使用しています。

一方、グラッドストーン研究所の他の研究室では、すでに脳、心臓、免疫系の研究にCHOIRを応用しています。「今日、多くの研究者がシングルセルデータを使用しており、CHOIRは多くの研究に応用可能です」とムッケ博士は言います。「この強力な新しい研究ツールが、科学と生物医学の多様な分野を発展させることを期待しています」。 

Nature Genetics誌に掲載された研究の中で、著者のライアン・コルセス(左)、レナート・ムッケ(中央)、カトリーヌ・サント(右)は、複雑な生物学的サンプル中の細胞を区別するための新しい計算アプローチを紹介している。

 

[News release] [Nature Genetics abstract]

この記事の続きは会員限定です