Nature子刊:單分子測序揭示鸚鵡模仿能力
日期:2012-07-04 08:00:23
研究團(tuán)隊(duì)通過單分子測序揭示了鸚鵡基因組的特殊區(qū)域,并采用第二代測序技術(shù)對(duì)單分子測序數(shù)據(jù)進(jìn)行了修正。文章發(fā)表在7月1日Nature Biotechnology雜志網(wǎng)站上。
如今單分子測序技術(shù)炙手可熱,這一新技術(shù)能生成超長的測序讀段,“能更容易拼裝基因組的復(fù)雜部分,”文章的共同作者Duke大學(xué)神經(jīng)學(xué)生物學(xué)家Erich Jarvis說。Jarvis感興趣的是調(diào)控鸚鵡模仿能力的基因序列,因?yàn)檫@些序列能為神經(jīng)學(xué)科學(xué)家提供人類語言能力相關(guān)調(diào)控基因的信息。
Jarvis及其同事最初采用第二代測序來裝配鸚鵡的基因組區(qū)域,第二代測序技術(shù)能一次讀取100到400bp,需要數(shù)天來裝配基因組構(gòu)架圖。然而,科學(xué)家測序后發(fā)現(xiàn)得到的讀長不足以裝配出鳴聲學(xué)習(xí)基因的某些調(diào)控區(qū)域。盡管研究人員嘗試了修改算法,仍無法解決這一問題。
去年羅氏454和Pacific Biosciences單分子測序技術(shù)的讀長都達(dá)到了1000bp。而Pacbio的技術(shù)能一次生成2,250 到23,000bp的數(shù)據(jù),能在約一天內(nèi)裝配整個(gè)基因組。
Jarvis及其同事采用了PacBio RS儀器來解決他們基因組測序遇到的難題。通過Assemblathon競爭,科學(xué)家發(fā)現(xiàn)Pacbio儀器在讀取虎皮鸚鵡(Melopsittacus undulates)基因組時(shí),難以精確解碼某些復(fù)雜區(qū)域,儀器的錯(cuò)誤率較高。Jarvis說,這種錯(cuò)誤率幾乎使他們難以用這些超長讀段進(jìn)行基因組裝配。
單分子測序儀器能生成超長序列,極大的改善基因組和轉(zhuǎn)錄組的裝配。不過,目前單分子測序讀取的錯(cuò)誤率較高,從而限制了其應(yīng)用(如細(xì)菌重測序應(yīng)用)。而第二代測序產(chǎn)生的讀段雖然短,但精確性更高。
研究人員引入了一種修正算法和裝配策略,應(yīng)用第二代測序產(chǎn)生的短高保真序列對(duì)單分子測序進(jìn)行了修正。他們成功將單分子測序(或稱為第三代測序)儀的錯(cuò)誤率從15%減少到了小于0.1%。由此,科學(xué)家終于裝配出了鸚鵡鳴聲學(xué)習(xí)行相關(guān)基因的調(diào)控區(qū)域(如FoxP2基因和egr1基因)。
這一研究成果能幫助神經(jīng)學(xué)科學(xué)家能更好的了解鳥類模仿和鳴唱的遺傳學(xué)機(jī)制。同時(shí)也能為科學(xué)家提供有關(guān)人類交流和語言學(xué)習(xí)能力的遺傳信息。
研究人員還對(duì)PacBio RS儀器生成的多種噬菌體、原核生物和真核生物的測序數(shù)據(jù)進(jìn)行了修正,驗(yàn)證了該方法的可靠性。Jarvis認(rèn)為科學(xué)家能夠通過使用混合性測序方法,解碼癌細(xì)胞發(fā)育相關(guān)的復(fù)雜基因和控制大腦功能的復(fù)雜基因序列。