高通量測序技術(shù)是對傳統(tǒng)測序一次**性的改變,一次對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,因此在有些文獻(xiàn)中稱其為下一代測序技術(shù)(next generation sequencing)足見其劃時代的改變,同時高通量測序使得對一個物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能,所以又被稱為深度測序(deep sequencing)。
自從2005年454 Life Sciences公司(2007年該公司被Roche正式收購)推出了454 FLX焦磷酸測序平臺(454 FLX pyrosequencing platform)以來,曾推出過3730xl DNA測序儀(3730xl DNA Analyzer)的AppliedBioSystem(ABI)這家一直占據(jù)著測序市場大份額的公司的地位就開始動搖了,因?yàn)樗麄兊娜^產(chǎn)品毛細(xì)管陣列電泳測序儀系列(series capillary array electrophoresis sequencing machines)遇到了兩個強(qiáng)有力的競爭對手,一個就是羅氏公司(Roche)的454 測序儀(Roche GS FLXsequencer),,另一個就是2006年美國Illumina公司推出的Solexa基因組分析平臺(Genome Analyzer platform),為此,2007年ABI公司推出了自主研發(fā)的SOLiD 測序儀(ABI SOLiD sequencer)。這三個測序平臺即為目前高通量測序平臺的代表。(見表一)
表一:主流測序平臺一覽
這些平臺共同的特點(diǎn)是極高的測序通量,相對于傳統(tǒng)測序的96道毛細(xì)管測序,高通量測序一次實(shí)驗(yàn)可以讀取40萬到400萬條序列。讀取長度根據(jù)平臺不同從25bp到450bp,不同的測序平臺在一次實(shí)驗(yàn)中,可以讀取1G到14G不等的堿基數(shù),這樣龐大的測序能力是傳統(tǒng)測序儀所不能比擬的。盡管如此,在這項(xiàng)新的劃時代的測序技術(shù)剛出現(xiàn)的時候,科學(xué)界對這項(xiàng)新技術(shù)卻并不熱衷。許多習(xí)慣用桑格技術(shù)的科學(xué)家懷疑新技術(shù)的準(zhǔn)確度、閱讀能力、成本消費(fèi)、實(shí)用性。代理Sanger型測序硬件的經(jīng)銷商害怕其投資失敗而首先提出了這些懷疑。
然而大多數(shù)人卻忽略了一個事實(shí),即桑格技術(shù)的普及初也遇到同樣的阻礙。桑格技術(shù)剛開發(fā)出來時,閱讀能力很難超過25bp,即使在Fred Sanger雙脫氧終止法發(fā)明后也只達(dá)到80bp,如今卻達(dá)到了750bp;而新發(fā)展的合成測序技術(shù),應(yīng)用焦磷酸測序方法,其閱讀能力初只有100bp,推向市場16個月后增加至250bp,隨著技術(shù)的不斷完善,目前已達(dá)到了400bp,很快就接近桑格技術(shù)目前的水平。除了閱讀能力外,能否以有限的成本用一臺儀器產(chǎn)生足夠數(shù)量的序列標(biāo)記也是另一個需要改善的重要問題。這個問題已經(jīng)被Roche公司解決了,應(yīng)用他們的系統(tǒng),僅花費(fèi)閱讀35bp或者更小片段的成本就能產(chǎn)生比35bp多10倍的序列標(biāo)記。
圖二:GS FLX 高通量測序方法原理示意圖
一、高通量測序的應(yīng)用
高通量測序可以幫助研究者跨過文庫構(gòu)建這一實(shí)驗(yàn)步驟,避免了亞克隆過程中引入的偏差。依靠后期強(qiáng)大的生物信息學(xué)分析能力,對照一個參比基因組(referencegenome)高通量測序技術(shù)可以非常輕松完成基因組重測序(re-sequence),2007年vanOrsouw等人結(jié)合改進(jìn)的AFLP 技術(shù)和454測序技術(shù)對玉米基因組進(jìn)行了重測序,該重測序?qū)嶒?yàn)發(fā)現(xiàn)的超過75%的SNP位點(diǎn)能夠用SNPWave技術(shù)驗(yàn)證,了一條對復(fù)雜基因組特別是含有高度重復(fù)序列的植物基因組進(jìn)行多態(tài)性分析的技術(shù)路線。2008年Hillier對線蟲CB4858品系進(jìn)行Solexa重測序,尋找線蟲基因組中的SNP位點(diǎn)和單位點(diǎn)的缺失或擴(kuò)增。但是也應(yīng)該看到,由于高通量測序讀取長度的限制,使其在對未知基因組進(jìn)行從頭測序(novo sequencing)的應(yīng)用受到限制,這部分工作仍然需要傳統(tǒng)測序(讀取長度達(dá)到850堿基)的協(xié)助。但是這并不影響高通量測序技術(shù)在全基因組mRNA表達(dá)譜,microRNA表達(dá)譜,ChIP-chip以及DNA甲基化等方面的應(yīng)用。
2008年Mortazavi等人對小鼠的大腦、肝臟和骨骼肌進(jìn)行了RNA深度測序,這項(xiàng)工作展示了深度測序在轉(zhuǎn)錄組研究上的兩大進(jìn)展,表達(dá)計(jì)數(shù)和序列分析。對測得的每條序列進(jìn)行計(jì)數(shù)獲得每個特定轉(zhuǎn)錄本的表達(dá)量,是一種數(shù)碼化的表達(dá)譜檢測,能檢測到豐度非常低的轉(zhuǎn)錄本。分析測得的序列,有大于90%的數(shù)據(jù)顯示落在已知的外顯子中,而那些在已知序列之外的信息通過數(shù)據(jù)分析展示的是從未被報道過的RNA剪切形式,3’端非翻譯區(qū),變動的啟動子區(qū)域以及潛在的小RNA前體,發(fā)現(xiàn)至少有3500個基因擁有不止一種剪切形式。而這些信息無論使用芯片技術(shù)還是SAGE文庫測序都是無法被發(fā)現(xiàn)的。
高通量測序另一個被廣泛應(yīng)用的領(lǐng)域是小分子RNA或非編碼RNA(ncRNA)研究。測序方法能輕易的解決芯片技術(shù)在檢測小分子時遇到的技術(shù)難題(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量測序的長度,使得數(shù)據(jù)“不浪費(fèi)”,同時測序方法還能在實(shí)驗(yàn)中發(fā)現(xiàn)新的小分子RNA。在衣藻、斑馬魚、果蠅、線蟲、人和黑猩猩中都已經(jīng)成功地找到了新的小分子RNA。在線蟲中獲得了40萬個序列,通過分析發(fā)現(xiàn)了18個新的小RNA分子和一類全新的小分子RNA。