世界の人口のおよそ10人に1人が、希少遺伝性疾患の影響を受けていますが、急速に進展する遺伝子技術や検査手法にもかかわらず、約50%の患者はいまだに診断されていません。たとえ検査にアクセスできたとしても、診断がつくまでに約5年、あるいはそれ以上かかることが多く、特に患者が子どもである場合、適切な治療を始めるには遅すぎることもあります。この問題の一因は、現在の臨床検査で主に使用されている「ショートリードシーケンシング」という手法にあります。この方法では、ゲノムの一部の領域にアクセスできず、診断に必要な重要な情報が見逃される可能性があります。  

 カリフォルニア大学サンタクルーズ校(UC Santa Cruz, UCSC)の研究者らは、これに代わる最先端技術「ロングリードシーケンシング(long-read sequencing)」の研究を推進しており、これはより包括的な変異検出データセットを提供し、複数の専門的検査を不要にし、希少疾患の診断を効率化できる可能性があります。

2025年1月24日付で『The American Journal of Human Genetics』誌に掲載された研究論文「Advancing Long-Read Nanopore Genome Assembly and Accurate Variant Calling for Rare Disease Detection(ロングリードナノポアによるゲノムアセンブリと高精度変異検出の進展が希少疾患診断を可能にする)」では、この技術が診断率を向上させ、診断にかかる期間を数年から数日に短縮できる可能性があることが示されました。この研究は、UCSCゲノミクス研究所の中核メンバーであるベネディクト・ペイトン博士(Benedict Paten, PhD)教授、カレン・ミーガ博士(Karen Miga, PhD)准教授、そして元ポスドクのジャン・モンロン博士(Jean Monlong, PhD)を中心に行われました。

「希少疾患の診断は長年にわたり困難を極めており、もし診断を効率化できるシーケンシング技術があるなら、それは大きな貢献になると考えています。本論文ではその可能性を検証しました」と、本研究の第一著者であり、UCSC生体分子工学専攻の博士課程に在籍するシュローカ・ネギ氏(Shloka Negi)は述べています。 

「現在の遺伝子検査による診断率は、非常に低いままです」とペイトン博士は語ります。「その原因の一つは、臨床で用いられているシーケンシング法が不完全であることにあります。本研究では、より包括的なロングリードシーケンシングが、診断に有用な追加情報を提供できるという仮説を検証しました。その結果、多数の潜在的に有意義な遺伝変異やエピジェネティックなシグナルを新たに発見できたことに、私たちは非常に興奮しています。まだ始まったばかりの段階ではありますが、この情報には大きな可能性があり、今後コミュニティ全体での解釈と理解が進むことが期待されます。」

 

希少疾患の発見に向けて

 この研究では、単一遺伝子の異常によって生じる「モノジェニック疾患」に焦点が当てられました。

科学者たちは、遺伝的疾患を診断するために、DNAの中から「変異」を探します。変異とは、遺伝子が正常に機能しなくなるような遺伝子配列の違いのことです。通常、これらの変異を特定するためには「ショートリードシーケンシング」という技術が使われます。この方法では、アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)という塩基が150〜250塩基対単位で読み取られます。 

しかし、このショートリードシーケンシングには限界があります。特に、250塩基対を超える長い塩基配列パターンが存在するゲノム領域では、重要な情報を見逃してしまう可能性があります。また、ショートリード法では「フェージング」と呼ばれる処理ができません。フェージングとは、変異が母親由来か父親由来かを判別するプロセスであり、たとえば2つの変異が同じ親から受け継がれたのか、それぞれ別の親からなのか、あるいはどちらの親からも受け継がれていないのかを特定できます。これは、特に親の遺伝情報が入手できない場合においても、遺伝診断にとって非常に有益な情報となります。

一方、「ロングリードシーケンシング」では、長いDNA配列を一度に読み取ることができるため、重要な遺伝子変異の情報を見逃すリスクを低減できます。また、ロングリード法はフェージングのデータを直接提供できるだけでなく、メチル化に関する情報も得られます。メチル化とは、遺伝子が「オン」または「オフ」に切り替わる化学的プロセスであり、疾患に寄与する場合もあります。

「ロングリードシーケンシングは、特定の症例では非常に有用であることが期待されており、私たちはその証明に向けて取り組んでいます」とネギ氏は述べています。

 

手法開発の先端に立つUCSC

 カリフォルニア大学サンタクルーズ校ゲノミクス研究所の研究者たちは、ロングリードシーケンシングの分野において革新的な手法と専門知識を長年にわたり築いてきました。そして現在も、幅広い健康研究の応用に向けて、シーケンシングと解析手法の最適化に取り組んでいます。彼らが達成した代表的な成果の一つである、真に完全な「テロメア・トゥ・テロメア(telomere-to-telomere)」リファレンスゲノムの構築に用いられた技術は、現在では患者の診断精度向上にも役立てられています。

 「以前の研究成果を再確認するかたちで、既存の不完全だが広く使われているリファレンスゲノムに代わり、『テロメア・トゥ・テロメア』の完全なゲノムを使うことで、ロングリードシーケンシングの利点が大幅に向上することが分かりました」と、ミーガ博士は述べています。「今後、ヒトの多様な遺伝的バリエーションを反映した“パンゲノム”と呼ばれるリファレンスが登場すれば、ロングリード技術の恩恵はさらに高まると考えています。」 

ペイトン博士とミーガ博士の研究室は、臨床医と連携し、42人の希少疾患患者の症例を対象に研究を行いました。その中には、ショートリード法や他の専門的検査で診断がついた患者もいれば、未診断のままの患者も含まれていました。中には、親の遺伝情報がある症例もありましたが、そうでない場合もありました。

患者のロングリードシーケンシングは、ミーガ研究室が主導し、UCSCで開発されたロングリードシーケンシング手法である「ナノポアシーケンシング」を用いて実施されました。この手法により、患者のゲノムを端から端まで高精度に読み取ることができ、1サンプルあたり約1,000ドルというコストで実現されました。 

得られたゲノムデータは、ペイトン研究室が開発した計算解析手法を用いて解析されました。使用された解析パイプライン「Napuパイプライン」では、小さな変異から大きな構造変異、フェージング情報、メチル化情報まで、すべてを一括で解析することができます。この解析プロセスは、使用するコンピュータの処理能力にもよりますが、およそ1日以内で完了し、解析コストは100ドル程度です。

 

診断へと導いた解析結果

患者データをロングリードで解析した結果、ショートリードシーケンシングでは得られないような網羅的なデータセットが得られました。

ロングリード法によって、42人の患者のうち11人に対して確定的な診断が得られました。これには、従来のショートリード法で得られていた情報だけでなく、新たに判明した希少な候補変異、長距離のフェージング、そしてメチル化の情報なども含まれており、すべてを1回の検査で迅速かつコスト効率よく取得することができました。

 11件の診断症例の中には、「先天性副腎低形成(congenital adrenal hypoplasia)」の4例が含まれていました。この疾患は、副腎が正常に機能せず、肥大化する希少疾患であり、原因となる遺伝子はゲノムの中でも特に解析が困難な領域に存在しています。この領域はショートリードシーケンシングでは解析できず、現行の臨床検査も煩雑かつ不完全です。

 「これらの症例を解決するために、私たちは“テロメア・トゥ・テロメア”のような高品質なゲノムアセンブリを統合する新しいパンゲノムツールを開発しました」と、本研究をペイトン研究室のポスドク時代に開始し、現在はフランスのINSERMに在籍するジャン・モンロン博士(Jean Monlong, PhD)は述べています。

 「本研究のコホートにおいて、この疾患を持つ4人すべての患者における病原性変異を検出し、フェージングすることができたことに、私たちは非常に興奮しました。将来的には、迅速かつ包括的な臨床検査としての実用化が期待されます。多くの希少疾患は、これまで解析が困難とされてきたゲノム領域に関係しているため、本研究の成果は、長年停滞していた分野に突破口を開くものとなるでしょう。」

さらに、2例は性分化疾患(disorders of sex development)に関連しており、1例はライディッヒ細胞低形成(Leydig cell hypoplasia)という、精巣内のライディッヒ細胞の未発達によって男性の性発達に影響を及ぼす稀な疾患でした。また、4例は神経発達障害に関するもので、いずれも長く困難な診断の旅路を経て、ようやく診断に至りました。

「ロングリードシーケンシングは、単一の遺伝子に明確な変異がある、あるいは明確な表現型がある未解決症例に対して、次に行うべき最良の検査方法となる可能性があります」とネギ氏は述べています。「この方法は、複数回の診療や検査を不要にし、数年かかる診断の旅を数時間に短縮できる単一の診断ツールとして機能することができるのです。」

 平均して、各患者には280の遺伝子(中にはメンデル遺伝病の原因となる遺伝子も含まれます)において、ショートリードでは検出できなかったタンパク質コーディング領域がロングリードでのみ網羅されていました。

 「ロングリードは、ゲノムのより多くの情報を解き明かす可能性を秘めています」とネギ氏は語ります。「とはいえ、この新しい情報を完全に解釈できるようになるには時間がかかるでしょう。これらのデータは、これまでショートリードベースの解析と標準リファレンスに基づいた臨床データベースには存在しなかったものです。今回の研究で、ロングリードはテロメア・トゥ・テロメアゲノムのうち、ショートリードではアクセスできなかった約5.8%の領域を明らかにできることを示しました。」

本研究には、UCSCの他の研究者として、ブランディ・マクナルティ氏、イヴォ・ヴィオリッチ氏、ジョシュア・ガードナー氏、トッド・ヒレイカー氏、サラ・オルーク氏も参加しました。また、他機関からの共同研究者も貢献しています。


[News release] [AJHG abstract]

この記事の続きは会員限定です