提高基因組作圖準確性的新方法
日期:2015-12-31 08:58:45
如果你已經(jīng)有了一種生物的基因組序列圖,但想要在一個樣本中尋找結(jié)構(gòu)異常,你可以檢查基因組條形碼(barcode)——已知的靶向位點之間的一系列距離,通過切割這些位點上的DNA序列,并檢測切口之間的距離。然而,如果通過新一代測序(涉及PCR)得到的原始圖,包含任何放大的偏差,研究當中的系統(tǒng)性錯誤還有改進的余地。為了解決這個問題,美國明尼蘇達大學(xué)和BioNano Genomics的研究人員,采用動態(tài)的時間序列數(shù)據(jù),來測量概率分布或者有多少遺傳物質(zhì)分開兩個標簽——根據(jù)鏈是否被拉伸或壓縮,來改進一種納米通道為基礎(chǔ)的基因組作圖。
這項研究的通訊作者、明尼蘇達大學(xué)科學(xué)與工程學(xué)院的Kevin Dorfman教授稱:“想象一下,在DNA骨架上的兩個標簽,通過一段彈簧連接在一起,這段彈簧模擬它們之間的DNA的構(gòu)型熵。如果這是一種諧波彈簧…那么,我們希望看到關(guān)于彈簧長度其余部分的正反置換的均等機率。”
但是,除了這個正常的曲線,Dorfman和他的同事們觀察到了比標簽之間延伸更大的壓縮,并發(fā)現(xiàn),標簽之間的大多數(shù)熱波動是短暫的事件,這些信息可能有助于提高基因組作圖的精度。
Dorfman說:“這種改善對于復(fù)雜的樣品(如腫瘤)尤其重要,這種樣品內(nèi)的細胞是異質(zhì)的,所以我們需要很高的精確度,找到罕見的事件。”
過去三年里,在國家衛(wèi)生部和國家科學(xué)基金會資助機構(gòu)的資助支持下,Dorfman和他的實驗室一直與BioNano Genomics的同事合作。他和他的同事們在本周《Biomicrofluidics》雜志詳細描述了這項研究工作。
用傳統(tǒng)的脈沖場凝膠電泳方法——通過用限制性內(nèi)切酶切割DNA序列來構(gòu)建基因組圖譜,研究人員所面臨的一個問題是,基因組圖譜的重新組裝,因為常規(guī)方法根據(jù)各種片段的大小對它們進行分類。然而,在納米通道方法中,熒光標記有序地停留在在每條鏈上。這讓研究人員能夠根據(jù)它們的熒光條形碼確定整條鏈的內(nèi)容,而無需重新組裝它們——不用依賴先前獲得的作圖。
研究人員首先標記DNA,這包括從大腸桿菌細胞中提取基因組DNA,在不同的靶位點上除去一個單一的核苷酸和骨干,并在它們的部位插入熒光核苷酸。每一條DNA鏈,通常約為300000個堿基對,然后注入45納米寬的通道。因為DNA的彎曲長度,迫使分子拉伸,它仍然以一種棒狀的、可量化的方式移動,大約50納米。
然后,他們使用數(shù)碼相機拍攝了標簽的位置。而對納米通道中的DNA進行的典型單分子研究,報告了幾十個分子的統(tǒng)計,研究人員的方法涉及到成千上萬各分子,每個分子都覆蓋一系列標簽——從而產(chǎn)生了數(shù)以百萬計的標簽之間的距離測量,這對于確定概率分布是必不可少的。
Dorfman及其同事們今后的工作包括,將這些分布輸入到基因組作圖算法中。這可以用來將點值圖的一段特定序列,分配到基因組的一個特定區(qū)域,也有助于理解基因組圖上拉伸DNA的結(jié)頭、褶皺和環(huán)結(jié)的影響。
下一篇: 單分子測序的精確甲基化組分析