基因組所 于軍 研究員
12月21日出版的美國《科學(xué)》雜志提出2013年的6個(gè)值得關(guān)注的科學(xué)領(lǐng)域, 包括單細(xì)胞測序、“普朗克”探測微波背景輻射、人類連接組計(jì)劃、探索南極冰下世界、癌癥免疫療法和基礎(chǔ)植物研究。六個(gè)領(lǐng)域中的五個(gè)都與生命科學(xué)有關(guān)。
其中排在第一位,帶有最新理念的,就是“測定每一個(gè)細(xì)胞的序列”。從表面上看,測序好像僅僅是測定DNA的序列,也就是測定每一個(gè)細(xì)胞所攜帶的遺傳物質(zhì)—-DNA的序列。但是其實(shí)不然,背后有更深刻的意義。
首先,人體的每個(gè)細(xì)胞(單倍體細(xì)胞只有性決定細(xì)胞:精子和卵子)通常帶有兩套染色體(每條染色體由一個(gè)DNA分子和眾多蛋白質(zhì)分子輔助組成),而且每個(gè)個(gè)體所擁有的千兆個(gè)細(xì)胞都來自同一個(gè)受精卵,理論上來講,這些細(xì)胞的DNA序列應(yīng)該百分之百是一樣的。所不同的只是經(jīng)過每一代人的DNA復(fù)制,基因組(所有染色體)的總體序列會(huì)有幾十個(gè)變化,稱為每一代之間的基因組突變率。盡管這個(gè)變化相對(duì)每一代人來說是很少的,但是日積月累,加之世界人群之巨大,總體的變化數(shù)量則是驚人的!在這些變化中,又有人類個(gè)體生老病死等因素的不斷加入,基因和它的組分—-DNA序列也在世代的變演中或被保留、或被拋棄、甚至被夸大、抑或僅僅是隨波逐流。當(dāng)然,這些存在于人群中的DNA序列變化也會(huì)與每個(gè)人引為自豪的優(yōu)勢(shì)有關(guān),也會(huì)與每個(gè)人不容樂觀的缺陷有關(guān),更會(huì)與我們的體能、長相、智慧、壽命、乃至疾病有關(guān)。這就是我們要測定更多人基因組序列的目的之一。我們要將基因組的這些變化與我們的“表型”(可見和可測定的標(biāo)征)關(guān)聯(lián)起來,找到DNA序列與表型的因果關(guān)系,即所謂的全基因組關(guān)聯(lián)研究。
其次,既然基因組序列的變化與細(xì)胞的種類無關(guān),那我們還在乎單個(gè)細(xì)胞嗎?有一個(gè)最直接的原因,那就是各種惡性腫瘤細(xì)胞往往有自己特殊的變異。這些變異的發(fā)生有兩個(gè)基本的途徑:其一是固有的但是并不馬上致瘤,但潛力可畏;其二是腫瘤細(xì)胞新產(chǎn)生的,既可以定性,也可以定量,更可以用來指導(dǎo)診斷、預(yù)后和治療。還有些腫瘤相關(guān)的變異可以產(chǎn)生新(對(duì),在正常狀態(tài)下沒有)的蛋白質(zhì),這些蛋白質(zhì)則可以作為藥靶來對(duì)待。另外,腫瘤細(xì)胞的特征之一是無限增殖,這里產(chǎn)生的變異之多,相關(guān)性之復(fù)雜都非常吸引人們?nèi)ド钊胙芯?。可見,單個(gè)細(xì)胞水平的研究會(huì)為腫瘤研究提供不少的腫瘤發(fā)生和不斷變演的線索。
第三,如果我們能測定每一個(gè)正常細(xì)胞的DNA序列,我們還會(huì)得到哪些有用的信息呢?答案是:很多。DNA測序歸根結(jié)底是一門技術(shù),一門非常有用的技術(shù)。盡管它的原理發(fā)明是上個(gè)世紀(jì)70年代的事情,但是“人類基因組計(jì)劃”的啟動(dòng)賦予它新的動(dòng)力和生命:我們要在這門技術(shù)的發(fā)展上投入很多很多的錢,就數(shù)量而言,可以說是空前絕后的:30億美元。結(jié)果是,這門技術(shù)不僅幫我們測定了一個(gè)人的基因組(也就是所謂“人類基因組計(jì)劃”)、數(shù)百個(gè)人的基因組(也就是所謂的“基因組單倍體型圖計(jì)劃”;該計(jì)劃粗略地測了幾百個(gè)人的基因組)、上千個(gè)人的基因組(即“1000人基因組計(jì)劃),乃至今天所談的:每個(gè)人的基因組和每個(gè)細(xì)胞的基因組。這個(gè)技術(shù)的發(fā)展之快,應(yīng)用之深廣,絕對(duì)是空前的。它對(duì)于科學(xué)發(fā)展的意義絕對(duì)超過航空母艦對(duì)現(xiàn)代戰(zhàn)爭的意義。
正是這樣一門技術(shù)支持了我們鑒別單細(xì)胞和單細(xì)胞功能差異的欲望。眾所周知,細(xì)胞是生命有機(jī)體的基本單元。人體就有近200種不同的細(xì)胞存在,有的在分化,有的在生長,有的在復(fù)制,有的在運(yùn)動(dòng),有的在支撐機(jī)體,有的在傳導(dǎo)信號(hào)等等。問題是:既然每個(gè)人的每個(gè)細(xì)胞都有相同的基因組序列(或DNA分子),這些細(xì)胞在DNA序列上的不同體現(xiàn)在哪里呢?回答之一是:在RNA分子里面。RNA和DNA一樣是細(xì)胞的重要“建筑材料”之一。它們的功能也很復(fù)雜,有的相當(dāng)于建筑材料,與蛋白質(zhì)一起構(gòu)成不同的功能結(jié)構(gòu);有的則編碼蛋白質(zhì),“指導(dǎo)”蛋白質(zhì)的合成;有的則是操作分子,參與很多細(xì)胞功能的調(diào)控,RNA可以說是“無孔不入”。也正是這些無孔不入的分子,才是細(xì)胞間非遺傳性差異的“始作俑者”。換句話說,細(xì)胞間的不同很大一部分是由它們的RNA內(nèi)涵所決定。這樣的話,用測定DNA的機(jī)器(通過將RNA“反轉(zhuǎn)錄”為DNA)來測定每細(xì)胞里的RNA組成正是單細(xì)胞測序的關(guān)鍵所在。每一個(gè)細(xì)胞里都有數(shù)千萬RNA分子。僅用來編碼蛋白質(zhì)的“信使RNA”(僅占總量1%)分子就有逾十萬種,近百萬之多。可想而知,強(qiáng)有力的測序技術(shù)此時(shí)此刻就更有了用武之地!
DNA測序技術(shù)在單細(xì)胞水平的應(yīng)用還不僅僅是如此。這里可以舉幾個(gè)實(shí)際的例子。一個(gè)是通過測定DNA序列來來找到重要調(diào)控蛋白質(zhì)與DNA 作用的部位(其實(shí)也是固定的序列),這個(gè)技術(shù)稱為ChIP-Seq(免疫沉淀-測序偶聯(lián))技術(shù),可以用來建立基因調(diào)控網(wǎng)絡(luò)(當(dāng)然也包括致病基因在內(nèi)了)。還有一個(gè)是通過測定被蛋白質(zhì)保護(hù)的部分DNA來確定染色體在細(xì)胞核內(nèi)的三維構(gòu)像和空間分布。目前的研究結(jié)果表明不僅僅是染色體的穩(wěn)定性,而且它的構(gòu)像和時(shí)空分布會(huì)與細(xì)胞的分化、凋亡、癌變等有關(guān)。另外,我們還可以細(xì)究蛋白質(zhì)復(fù)合體(如核小體)的排列(包括排列的致密度和位置)來估計(jì)基因簇的被調(diào)控狀態(tài):協(xié)同、相左還是獨(dú)立?此類例子可以更多,甚至有更長的解釋??傊?,這些技術(shù)都可以在單細(xì)胞水平來觀察變化,疾病的一部分就體現(xiàn)在細(xì)胞水平基因調(diào)控的不正常。比如,胰島細(xì)胞(分泌胰島素)調(diào)控得不正常就導(dǎo)致糖尿病。又如,衰老個(gè)體的細(xì)胞和年輕個(gè)體的細(xì)胞在遺傳總體上和基因調(diào)控上有何不同?我們目前還沒有直接的手段來用實(shí)驗(yàn)和數(shù)據(jù)來回答這個(gè)問題,或許在單個(gè)細(xì)胞水平的研究上這些問題都會(huì)迎刃而解。
就技術(shù)而言,單細(xì)胞測序的關(guān)鍵和特色至少有在四個(gè)方面體現(xiàn)出來。第一,我們必須要建立各種單細(xì)胞的觀察、觀測和分離技術(shù)。流式細(xì)胞儀是目前高通量分離細(xì)胞的工具之一,但是要做到分離和研究單個(gè)細(xì)胞,我們必須要有顯微處理的能力和相關(guān)儀器。微納加工技術(shù)和微流控技術(shù)的掌握和應(yīng)用應(yīng)該是不可少的。第二,我們要開發(fā)基于單細(xì)胞的DNA和RNA分離和分析技術(shù)。盡管DNA測序可以用擴(kuò)增后的DNA來測序,但是無擴(kuò)增技術(shù)會(huì)更好地體現(xiàn)細(xì)胞的原始狀態(tài)。第三,我們要建立單細(xì)胞基因表達(dá)和調(diào)控的數(shù)學(xué)計(jì)算模型。筆者在十幾年前曾與提出單細(xì)胞測序概念的胡德(Leroy Hood)教授切磋對(duì)“竭澤而漁”和“擲網(wǎng)而漁”之間的不同和邏輯關(guān)系的理解,筆者認(rèn)為也許只有在“自然生態(tài)”下我們才能真正理解不同“魚兒”(基因)間的生存(功能)和依賴(相互作用)。因?yàn)榧?xì)胞間的不同是絕對(duì)的,因?yàn)椴粌H不同的細(xì)胞不可能有相同的基因在表達(dá)譜(基因表達(dá)的全部),而且相同細(xì)胞的基因表達(dá)譜也會(huì)不同(視分辨率的不同而定)。因?yàn)榧?xì)胞內(nèi)基因表達(dá)量的均值時(shí)小于一的。也就是說,細(xì)胞里有很多基因的表達(dá)量非常低,低到幾十、乃至幾百個(gè)細(xì)胞才有這個(gè)基因的一個(gè)轉(zhuǎn)錄本(拷貝)??梢?,單細(xì)胞測序不是沒有挑戰(zhàn)的,不僅僅是技術(shù),而且包括理論。第四,達(dá)到在單細(xì)胞水平研究生命現(xiàn)象和基因的關(guān)系,我們極有必要將DNA測序技術(shù)推向單分子水平。這樣我們就舍去了DNA的擴(kuò)增。目前的單分子DNA測序儀還不成熟,新的競爭還剛剛開始。單分子測序得優(yōu)勢(shì)在于我們不僅可以不用擴(kuò)增地看到基因變異和表達(dá)的全貌,而且可以偵查到剛剛(實(shí)時(shí))發(fā)生的微妙變化。更可以看到每個(gè)DNA分子和RNA分子上的化學(xué)修飾。因?yàn)槲覀冎繢NA至少有四種化學(xué)修飾的狀態(tài),RNA 則含有少數(shù)(一百余種)化學(xué)修飾的核苷酸。由于不能容易地測定這些化學(xué)修飾核苷酸的存在和動(dòng)態(tài)變化,我們無從知道它們?cè)贒NA和RNA分子上的準(zhǔn)確功能。好在目前的測序技術(shù)允許我們粗略地知道哪些位點(diǎn)(序列的位置)可以有修飾的核苷酸存在,而且它們的動(dòng)態(tài)變化被稱為是表觀遺傳學(xué)研究的內(nèi)容,有些甚至與癌變有關(guān)。&單細(xì)胞DNA測序的本質(zhì)是基因組學(xué)技術(shù)在細(xì)胞生物學(xué)上的應(yīng)用,這不僅充分體現(xiàn)了學(xué)科的交叉和互動(dòng),也指出了不可忽視基因組學(xué)技術(shù)的高速發(fā)展。就DNA測序技術(shù)而言,它的數(shù)據(jù)產(chǎn)生速度已經(jīng)超過了計(jì)算機(jī)的計(jì)算能力發(fā)展速度(摩爾定律)。很可惜的是,我國目前還沒有真正重視這一技術(shù)的發(fā)展。目前的研制焦點(diǎn)在第三代測序技術(shù),其特點(diǎn)為:單分子、讀長長、低成本。目前廣泛使用的是第二代設(shè)備,足以幫助我們測定各類基因組的序列,并且啟動(dòng)前期單細(xì)胞水平的研究。&在科學(xué)上絕無一勞永逸的事件,只有一磚一瓦,只有起重與降落的周而復(fù)始,不知不覺中“科學(xué)的大廈”就拔地而起。在隨之聳入云端時(shí),我們看到總是更遠(yuǎn)和更廣,當(dāng)然也就更美。到時(shí)候,我們會(huì)問自己:我們中國科學(xué)家所添加的那一塊磚、一塊瓦在哪里呢?新的一年,永遠(yuǎn)鼓勵(lì)我們要有新的起點(diǎn),我們2013年的新起點(diǎn)至少可以是第三代DNA測序技術(shù)的研發(fā),因?yàn)閱渭?xì)胞測序終極目標(biāo)的實(shí)現(xiàn)需要新一代測序儀的支持:測定每個(gè)(正常的和疾病的)細(xì)胞里每一個(gè)DNA和RNA分子的精準(zhǔn)序列。