人間の体を作る設計図、ゲノム。その中には、私たちがまだ知らない「未知のタンパク質」が数多く隠されているかもしれません!長年、人間のタンパク質をコードする遺伝子は約19,500個だと考えられてきましたが、近年の研究で、これまで見過ごされてきた小さなタンパク質「マイクロタンパク質」の存在が次々と明らかになっています。

Nature誌に掲載された画期的な論文「「Expanding the human proteome with microproteins and peptideins(マイクロタンパク質とペプチドインによるヒトプロテオームの拡張)」」において、エリック・W・ドイチュ(Eric W. Deutsch)博士らの研究チームは、これまで見過ごされてきたタンパク質の全体像を明らかにしました。

人間の健康を研究する上で、タンパク質をコードするゲノムを解明することは非常に重要です。しかし、過去の分析で何が見落とされてきたのかという根本的な疑問がずっと残っていました。過去10年間で、非カノニカルオープンリーディングフレーム(ncORF: non-canonical open reading frames)の翻訳が、ヒトの様々な細胞型や疾患状態において観察されており、生物医学科学に大きな影響を与えています。しかし、どのncORFが小さなマイクロタンパク質や代替タンパク質分子を作り出し、ヒトのプロテオームに貢献しているのかは、これまで知識の空白となっていました。

今回、TransCODEコンソーシアムの共同研究により、ncORFに関するタンパク質レベルの証拠のコンセンサスが構築されました。95,520件の大規模なプロテオミクス実験の分析において、7,264個のncORFのうち約25%から検出可能なペプチドが生み出されていることが示されました。

ドイチュ博士らは、ncORFがコードするマイクロタンパク質を「ヒトタンパク質」として注釈するためのフレームワークを開発しました。さらに、機能的なタンパク質としての可能性がまだ不確定なマイクロタンパク質を表す、新たな概念的モデルである「ペプチドイン(peptideins)」を体系化しました。

ペプチドインの生物学的な意味を探るため、研究チームは「ORF相対ブランチ長(ORBL: ORF relative branch length)」と呼ばれる進化解析アプローチを作成しました。その結果、進化的な制約が一般的であり、それがncORF由来のペプチドの観察と関連していることを突き止めました。さらに、OLMALINCという長鎖ノンコーディングRNA(lncRNA: long non-coding RNA)から作られる1つのペプチドインについて、細胞の生存に不可欠な表現型を特徴付けました。

ヒトゲノムが、標準的な約19,500個のタンパク質コード遺伝子よりも実質的に多くのものをコードしているかどうかは、近年活発な議論の的となってきました。タンパク質コード遺伝子は、医薬品開発プログラムの圧倒的多数を含む生物医学調査の基盤です。したがって、タンパク質コード遺伝子が大規模に追加されれば、ヒトの生物科学全体に大きな波及効果をもたらします。

これまで、ncORFやそれらがコードするポリペプチドは「ダークプロテオーム(dark proteome)」の一部として広く報告されており、疾患の遺伝的基盤やがん生物学のメカニズム、免疫療法の標的となる抗原などへの貢献が期待されています。全体として、研究チームはGENCODEやPeptideAtlasによってサポートされる公開研究ツールを構築し、ヒトプロテオームのこれまで十分に研究されていなかった構成要素に対する生物医学的発見を前進させました。

https://www.nature.com/articles/s41586-026-10459-x.pdf

この記事の続きは会員限定です