シンガポールのゲノム研究所(GIS)の研究者が、初となる生物のDNA配列を再構築する計算ツールを開発した。このツールの信頼性については保証されており、これによってゲノム配列の再構築と研究を合理化することが可能になる。2011年11月10日付けのComputational Biology誌に記載された今回の研究は、GIS計算数理生物学のアシスタント・ディレクターであるニランジャン・ナガラジャン博士が率いている。
生命(同様に、植物や動物)のゲノム研究は、計算ツールに基づき、ゲノム生物のDNA配列をつなぎ合わせるゲノムアセンブリとよばれるプロセスを行う。これは、ジグゾーパズルまたはバラバラになったページの文字を合わせていくようなものだ。この課題の規模の大きさのために、既存のゲノムアセンブリは結果オーライ的なアプローチに依存しており、しばしばゲノムの不正再構築につながる。今回発表された研究のゲノムアセンブリには、初めてアルゴリズムが使用され、大規模なデータでも品質を保証した。このアルゴリズム法を改善し具体化したOpera(オペラ)と呼ばれるフリーソフトは、http://sourceforge.net/projects/operasf/から入手可能である。
GISで使用されたのもこのオペラであり、大きな植物や動物のゲノムを組み立てるのに成功している。
組み立てられたゲノムは、下流の生物学的調査の基盤を形成し、後の研究のための重要なリソースとなる。
例えば、数十億ドルかけて得られたヒトゲノムのドラフトは、生物医学研究のための基本的なリソースとして利用されているが、いまだに改良が続けられている。このように、改良されたアセンブリのツールはデータから得られる最も完全かつ正確なゲノムのドラフトを生成することが出来る。
ドラフトのアセンブリを改良し、修正するために必要な骨の折れるような努力を最小限に抑え、かつアセンブリ関連の間違いから発生するデッドエンドを回避することが出来るのだ。「人の健康(感染症など)、農業、畜産、そしてバイオ燃料などのバイオ経済に関連する生物の遺伝学的研究は、ゲノム配列の可用性によって機能しています。
この研究は、より完全で正確なドラフトゲノムを再構築する、新しい数理的なアプローチを用います。アルゴリズムの観点から見ますと、Operaは明確な指摘化機能の有用性を示し、さらに、パラメトリック複雑解析から得られる正確なアルゴリズムを用いて一見手に負えない問題でも、強固な解決案を提供することが出来るのです。」と、ナガラジャン博士は説明する。
「Operaはゲノムアセンブリアルゴリズムにおいて重要な進歩です。現在利用可能なものの中では随一のゲノム組み立て機でしょう。Operaでは、ナガラジャン博士のチームがゲノム組み立てのための精密な理論フレームワークを開発し、実用的な導入に移していて、著しいパフォーマンスを見せています。
この分野で過去30年間にわたり行われてきた相当量の研究と近年のシーケンシング技術の進歩をふまえて考えると、この結果はとても素晴らしいものです。」と、メリーランド大学計算機科学科准教授兼バイオインフォマティクス計算機科学センター臨時ディレクターのミハイ・ポップ博士は語る。
GISはシンガポール科学技術研究庁(A*STAR)傘下の研究機関である。
[BioQuick News: Streamlined Approach for Reconstructing Accurate DNA Sequence"> [Press release"> [Journal of Computational Biology abstract">



