搡老女人多毛老妇女中国,日韩亚洲欧美中文高清在线,人妻少妇一区二区三区,色妞色综合久久夜夜,日本熟妇xxxx

Nature Methods:De Novo基因組序列組裝的新方法

日期:2016-05-18 09:26:18

 對(duì)于de novo人類(lèi)基因組序列組裝而言,短讀長(zhǎng)簡(jiǎn)直意味著不可能的任務(wù)。不過(guò),加州大學(xué)舊金山分校、BioNano Genomics10X Genomics的研究人員近日開(kāi)發(fā)出一種新的組裝方法,它將short-read測(cè)序與10Xlinked-read測(cè)序相結(jié)合。這項(xiàng)成果于近日發(fā)表在《Nature Methods》上。

 

如今,測(cè)序人類(lèi)基因組已并非難事,但如果要獲得高質(zhì)量的基因組序列組裝,人們必須克服三大挑戰(zhàn):1) 幾乎100%相同的重復(fù)序列,它們存在于大多數(shù)高等真核基因組中;2) 二倍體的DNA3) 缺乏能夠產(chǎn)生準(zhǔn)確的長(zhǎng)讀取的低成本測(cè)序平臺(tái)。

 

去年,西奈山伊坎醫(yī)學(xué)院的Matthew Pendleton去年開(kāi)發(fā)出一種方法,將Illumina測(cè)序、PacBio測(cè)序和BioNano Genomics的基因組作圖相結(jié)合,對(duì)HapMap樣品NA12878進(jìn)行了高質(zhì)量的組裝。不過(guò),這種方法的缺點(diǎn)在于PacBio測(cè)序的成本相對(duì)較高,通量較低。

 

于是,加州大學(xué)舊金山分校的Pui-Yan Kwok及其同事用10X Genomicslinked-read數(shù)據(jù)取代了Pacific Bioscienceslong-read序列。在一項(xiàng)試驗(yàn)性研究中,他們利用這種方法來(lái)測(cè)序和組裝HapMap項(xiàng)目的個(gè)體基因組,看看效果如何。

 

這種新方法主要依靠?jī)蓚€(gè)平行過(guò)程。首先,利用SOAPdenovo短寡核苷酸分析軟件將Illumina的序列組裝成scaffold。為了讓這些scaffold有序排列成更長(zhǎng)的片段,研究人員調(diào)入10X GemCode平臺(tái)所產(chǎn)生的序列數(shù)據(jù),并利用fragScaff來(lái)產(chǎn)生新的scaffold。同時(shí),他們利用BioNano GenomicsIrys系統(tǒng)來(lái)產(chǎn)生序列motif的物理圖譜,之后結(jié)合10X scaffold來(lái)產(chǎn)生最終的混合組裝圖譜。然后,他們利用10X Long Ranger軟件對(duì)混合組裝的scaffold進(jìn)行分相,并借助BioNano Genomics的圖譜來(lái)分辨一些重復(fù)區(qū)域。

 

在試驗(yàn)性研究中,研究人員利用這種方法對(duì)人類(lèi)HapMap樣品NA12878進(jìn)行組裝和分相。最初的Illumina組裝產(chǎn)生了超過(guò)14,000個(gè)scaffold,而N500.59 Mb。在混合組裝后,scaffold數(shù)量降為170個(gè),而N50大小達(dá)到33.5 Mb,相對(duì)之前有57倍的改善。

 

與參考基因組相比,研究人員發(fā)現(xiàn)他們的組裝結(jié)果比2011年發(fā)表的ALL-PATHS組裝更準(zhǔn)確,與Pendleton等人的方法有95.2%相似。此外,他們還指出,95.7%的外顯子存在于他們的新組裝中。

 

盡管Kwok及其同事認(rèn)為這種方法是一種改進(jìn),但也存在一些局限。例如,10X的方法依賴(lài)于高分子量DNA的制備,這對(duì)長(zhǎng)期保存的樣品而言很難做到。另外,linked-read是通過(guò)50-100 kb分子的隨機(jī)k-mer擴(kuò)增產(chǎn)生的,但這些分子不一定北擴(kuò)增。因此,人們需要產(chǎn)生不同大小的多個(gè)測(cè)序文庫(kù),這增加了工作量。

 

“通過(guò)這個(gè)原理驗(yàn)證研究,我們證明了使用這三組互補(bǔ)的作圖-測(cè)序數(shù)據(jù)能克服之前的限制,而普通實(shí)驗(yàn)室可在短時(shí)間內(nèi)以合理的成本平行生成這些數(shù)據(jù),”作者在文中寫(xiě)道。