|
|
|
2.全ゲノムショットガン戦略の確立 |
2.1 全ゲノムショットガン法
J. Craig Venterは、NIH(米国立保健研究所)を離れて私設の研究所TIGR(The Institute for Genome Research)を設立し、そこでヒトのメッセンジャーRNAから合成したcDNA断片のアッセンブリのためのアルゴリズムを開発した(13)。このアルゴリズムを使ってVenterと共同研究者は、1995年に、180万塩基からなるインフルエンザ菌ゲノムの解読に成功し(14)、全ゲノムショットガン法が微生物の全ゲノム塩基配列決定に有効であることを初めて示した。それでも、大型で反復配列の多いヒトゲノムに全ゲノムショットガン法を適用するのは無理であると、多くの研究者は考えていた。
全ゲノムショットガン法は、ゲノム全体を最初から物理的手段で断片化する。こうして得られた大量の断片を片端からシーケンサで読んだ後、それぞれの末端領域にある配列を断片ごとに照合して、同じ配列をもつものを探し出して重ね合わせてゆく。理論的には、全ゲノムの約10倍に相当する配列を読めば、それぞれの断片が整列し連続することになる。つまり、全ゲノムショットガン法成功の鍵は、シーケンサから生産される膨大な量の塩基配列情報を処理するためのアルゴリズム開発とそれが作動するコンピュータ能力にあるとも言える。
2.2 階層的ショットガン法
これまでのゲノム配列決定法は、先ず、複数の制限酵素による切断部位の位置を決定して、ゲノムDNAの物理地図を作成するところから始まる。この地図に基づいて整列させたクローンをつくり、各々のクローン化された断片を、ショットガン法でさらに細かくして配列を決めてゆく(図3)。
2.3 ヒトゲノム解析計画への挑戦
ヒトゲノムを民間資本で短期間に解読するというアイデアをもたらしたのは、PRISM3700の完成を目にして自信を得たHunkapillerである。1998年1月、PRISM3700を市場に送りだす前に、HunkapillerはVenterをABIに招き、PRISM3700を見せた(15)。
そこでHunkapillerは、ヒトゲノムの解析を行い、そのデータベースを売る会社の設立を提案し、パーキン・エルマー社が、ヒトゲノムの解読に必要な数のPRISM3700と、解読にかかる資金を提供する用意があると、Venterに伝えた。HunkapillerとVenterは、その計画について議論を重ね、全ゲノムショットガン法を採用することにした(16)。
全ゲノムショットガン戦略では、モジュール系稼働システム(図4)(17)を、試料の調整からデータアッセンブリの過程に適用した。その工程は以下のような4段階、(i)DNA断片ライブラリーの作成、(ii)DNAテンプレートの作成、(iii)ジデオキシ塩基配列決定反応と試料の精製、(iv)PRISM3700 DNAシーケンサによる塩基配列決定に分けられている。
こうして、300台のPRISM3700と、世界最速とも言われるスーパーコンピュータを装備した大規模DNA配列解読工場、セレラ社が1998年設立された。ここでヒトゲノムの解読に取りかかる前に、Venterは、ハエゲノム解析プロジェクトの研究者と共同で、先ず、1億2000万塩基からなるショウジョウバエゲノムの解読を行った(18)。解読期間はわずか4カ月だった。ここでは主として、全ゲノムショットガン法の中枢ともいえるアッセンブラ・アルゴリズム、すなわち、シーケンサから生産される膨大な塩基配列の生データを整列化するコンピュータ・プログラムがヒトゲノムと同じように複雑で反復配列の多いハエゲノムDNAの整列化にも有効かどうかが試された。その結果、全ゲノムを読む回数が10回以下でも機能する、優れたアッセンブラを開発したことが明らかになった。
2.4 ヒトゲノム概要の解読
ヒトゲノムの塩基配列を、全ゲノムショットガン法で読みとる作業は、1999年9月8日に開始され、2000年6月17日に完了している。それは、2001年2月16日号のScience誌上で、「The sequence of the human genome」と題して報告された(17)。そして、その前日に発行されたNature誌には、国際ヒトゲノム計画に携わった世界中の科学者の名前と共に、「Initial sequencing and analysis of the human genome」と題する論文が掲載された(19)。HunkapillerとVenterの挑戦が、「国際ヒトゲノム計画」の当初の予定を繰上げさせる結果となり、まさに新世紀が始まらんとする時期に、概要版とは言え、われわれはヒトゲノムの、これまでで最も詳細な全ゲノム情報を、二つも目にすることができたのである。 |
|