單分子測序輕松升級參考基因組
日期:2012-09-06 08:23:18
現(xiàn)代基因組學(xué)的最大需求之一,就是得到人類和模式生物的高質(zhì)量完成基因組。目前,人們利用二代測序技術(shù)對越來越多的物種(從原核生物到真核生物)進行了基因組測序,取得了許多重要的研究成果。
不過大部分物種的基因組還中存在有大量的缺口gap,就目前的數(shù)據(jù)來說,各種已測序物種的基因組中缺口gap所占的百分比從1.3%至13%不等。這是由于二代測序技術(shù)生成的片段短,而過短的測序片段無法跨越高度重復(fù)和高GC含量的基因組區(qū)域。大量的基因組空白區(qū)域中可能存在有重要的生物學(xué)功能信息,如果無法補齊這些缺口,不僅不能獲得完整的基因組物理結(jié)構(gòu)圖,還會給基因組信息的解讀造成不小的困難。目前人們主要使用步進PCR結(jié)合Sanger測序或者illumina/454 Pair-end測序數(shù)據(jù)來填充空白區(qū)域,但是這些方法費時費力,成本高,填充效率低,無法從根本上解決問題。
美國Baylor醫(yī)學(xué)院的Richard Gibbs團隊正在進行一項重要研究,利用單分子測序技術(shù)對模式生物的基因組草圖進行升級。他們借助的正是Pacbio RS單分子測序的獨特之處,這一技術(shù)無需PCR過程,能夠輕松完成高GC含量片段和高度重復(fù)區(qū)域片段測序。該研究團隊的目標(biāo)是準確、自動化、快速且可重復(fù)的進行基因組升級,他們還專門開發(fā)了高度自動化的工具PBJelly,能夠?qū)?/SPAN>Pacbio測序得到的長片段與基因組草圖進行比對,填補或減少草圖中的缺口,從而完善基因組草圖。
Richard Gibbs的團隊利用PacBio的長讀長,對兩個果蠅種(Drosophila pseudoobscura和Drosophila melanogaster,基因組缺口6.7M,占基因組大小5%)、虎皮鸚鵡(M. undulates,基因組缺口155M,占基因組大小11%)、黑子白眉猴(C.atys,基因組缺口198M,占基因組大小7%)的基因組進行了升級。他們首先利用PacBio單分子測序技術(shù)進行覆蓋(深度從4.4×到24×不等),然后使用PBJelly流程進行分析。研究顯示長讀長數(shù)據(jù)可以大大降低基因組中的缺口數(shù),其中D. melanogaster的基因組缺口數(shù)減少了15倍,虎皮鸚鵡和白眉猴的基因組缺口數(shù)減少了1.3至2.8倍,且這些基因組的缺口大小也減少了3-6倍。隨后,研究人員對隨機選擇的96個缺口進行了Sanger測序,驗證了這一方法的可靠性。
在這一研究中,單分子測序技術(shù)幫助研究者們獲得了很好的結(jié)果,大大提高了基因組的完整性,也降低了后續(xù)實驗和分析的難度,遠遠優(yōu)于傳統(tǒng)方法。
研究人員對于含有大基因組的脊椎動物(虎皮鸚鵡基因組大小1.2G、黑子白眉猴2.8G)只進行了低深度的測序(4.4-6.8×)就能較好的改善其基因組完整性,說明PacBio測序技術(shù)在大型基因組組裝領(lǐng)域具有強大的功能和應(yīng)用潛力。
該項目還在繼續(xù)進行中,研究人員將會不斷的改進組裝方法,提高基因組缺口的填補效率。目前,他們正在用這一方法對靈長類動物的基因組進行升級。
上一篇: 讓人躁狂的基因