カメラの進歩と同様、一般的なバイオインフォマティクスデータの可視化手法の重要な数学的更新により、単一細胞遺伝子発現のスナップショットが数倍の速さ且つ遥かに高い解像度で作成できるようになった。
2019年2月11日にNature Methodsに掲載されたこのエール大学の数学者による革新は、100万点のシングルセルRNAシーケンス(scRNA-seq)データセットのレンダリング時間を3時間以上からわずか15分に短縮するものだ。

 

この論文は「単細胞RNA配列データの可視化を改善するための高速補間ベースのt-SNE(Fast Interpolation-Based t-SNE for Improved Visualization of Single-Cell RNA-seq Data.)」と題されている。

科学者たちは、既存の10年前の方法であるt 分布型確率的近傍埋め込み(t-SNE:t-distributed Stochastic Neighborhood Embedding)は、単一細胞レベルで集められたRNA配列決定データ(scRNA-seqデータ)のパターンを二次元で表現するのに最適だと言う。


「t-SNEは発現する遺伝子によって細胞を纏め、新しい細胞型と細胞状態を発見するために使用されてきた。」と論文の筆頭著者であるエール大学の応用数学を専門とするGeorge Linderman博士は語った。

しかし、計算標準では、t-SNEは非常に遅い。 したがって、研究者はしばしばt-SNEを適用する前に、scRNA-seqデータセットを「ダウンサンプリング」する。 しかし、ダウンサンプリングはt-SNEが希少細胞集団を捕獲することを出来なくするので、妥協案としては不十分だ。
30年以上前に、エール大学の別の数学者チームが高速多極子法(FMM:fast multipole method)を開発した。これは、多体問題における長距離力の計算をスピードアップする革新的な数値手法だ。本研究の研究者らは、FMMの原理は非線形次元削減問題にも適用できることを確認し、FIt-SNE(fast interpolation-based t-SNE)と名付けた。

「我々のアプローチを使用すると、研究者は単一細胞RNA配列決定データをより迅速に分析することができるだけでなく、データがt-SNEより前にサブサンプリングされると検出できない希少細胞亜集団の特徴付けにも使用できる」と上級著者でエール大学病理学教授のYuval Kluger博士は述べた。さらにチームはFIt-SNEの結果にヒートマップ形式の視覚化を使用した。これにより、研究者は単一細胞のレベルで何千もの遺伝子の発現パターンを同時に見ることが容易になる。

時を同じくして、2018年12月にサイエンス誌は、scRNA-seqデータに基づく可視化なしでは達成不可能な、細胞ごとに胚の発生を追跡することを今年のブレークスルーとして掲載した。

( https://vis.sciencemag.org/breakthrough2018/ )

FIt-SNEは、発生生物学分野ならびに神経細胞研究や癌研究など、単一細胞シーケンシングが脳や腫瘍の理解のための非常に貴重なツールとなっているように、さらに研究を加速するだろう。と研究者らは述べた。
FIt-SNE用のソフトウェアとヒートマップ形式の視覚化は、次のWebサイトから入手できる。

https://github.com/KlugerLab/FIt-SNE
https://github.com/KlugerLab/t-SNE-Heatmaps

Nature Methodsの論文に関する他の著者には、Manas Rachh氏、Jeremy G. Hoskins氏、Stefan Steinerberger氏が含まれている。

【BioQuick News:Mathematical Advance at Yale Improves Speed & Resolution of RNA Data Visualization, Should Accelerate Work on Science Magazine’s 2018 “Breakthrough of the Year”—Following Embryonic Development Cell by Cell

この記事の続きは会員限定です