Science發(fā)布基因組測序重大突破
日期:2016-04-05 09:06:29
基于更長序列讀取的一項測序新技術,使得研究人員第一次發(fā)現(xiàn)了錯過的一些基因和遺傳變異形式。現(xiàn)在他們以接近小鼠和人類基因組的高質量,完成了對西部低地大猩猩(Western lowland gorilla)的基因組測序和組裝。提供了在與人類的進化親緣關系上僅次于黑猩猩的這一生物物種的一些生物學新見解。
在發(fā)表于4月1日《科學》(Science)雜志上的研究論文中,華盛頓大學基因組科學教授Evan Eichler領導的研究人員解釋了,為什么以往大猩猩和其他哺乳動物基因組組裝一直支離破碎、不完整、并且有可能具有誤導性的原因:
大規(guī)模平行測序技術,在提高速度,改善精度和降低基因組測序成本的同時,通常只生成短序列片段(read),在測序后采用基因組組裝軟件將這些reads拼合到一起。
這一程序試圖利用序列reads之間的重疊來重建原基因組。不幸地是,在人類和其他靈長類動物基因組中常見的長重復DNA,會使組裝軟件發(fā)生混亂,將基因組打碎成非常小的片段。
Eichler說:“這樣的組裝就像瑞士奶酪。在缺口(gap)中有許多錯失的生物學信息。”采用短read技術構建的原西部低地大猩猩基因組被打碎成40多萬個片段。
“這些缺口并非隨機,而是集中在重復序列位點。如果遺傳學家不能捕獲這些重復序列,確定基因組中的一些結構差異,他們會難以了解基因的組織及比較物種內及跨物種的遺傳變異。”
Eichler研究小組分析了來自芝加哥Lincoln動物園的一只雌性西部低地大猩猩的血液樣本。
研究人員利用單分子實時(SMRT)測序技術、組裝工具Falcon和QUIVER,以及其他的技術生成了長序列reads。比最流行的測序技術長度多100多倍。這些長reads使得他們能夠在組裝時仔細研究大猩猩基因組的大多數(shù)重復序列區(qū)域。
結果組裝出了更大、片段數(shù)少得多的新大猩猩基因組。相比以往的40萬個片段,現(xiàn)在只有1800個片段?;蚪M片段的平均大小增大了800倍,填補了原組裝中約90%的缺口。
研究人員觀察發(fā)現(xiàn),這些附加的序列信息大大提高了對這一大猩猩物種的基因注釋。它也促成發(fā)現(xiàn)了在首次基因組組裝錯過的、成千上萬的蛋白質和肽編碼片段以及新調控元件。
基因組控制機制上的差異,或某些基因調控元件的喪失或破壞,或許可以解釋人類祖先進化成與類人猿近親如此不同的原因。
科學家們還發(fā)現(xiàn)了數(shù)以萬計的新結構變異,諸如DNA缺失與插入,這有可能比以往編錄的較小的單堿基對差異要重要得多。
Eichler說:“我研究人類和類人猿基因組的動機就是,了解是什么給我們打上了作為一個物種的記號。我想看到重新測序包括黑猩猩和紅毛猩猩在內的所有大猩猩基因組,獲得區(qū)別人類和類人猿的遺傳變異的全面視圖。我相信存在比我們以往認為要多得多的遺傳變異。第一步就是找到它。”
在這些區(qū)域研究人員看到了人類和大猩猩之間一些有趣的差異,存在于與感官知覺、角蛋白生成、胰島素調控、免疫、生殖和細胞信號傳導相關的基因中。
新基因組組裝還提供了有關低地大猩猩進化史的一些新線索。以往的研究證實,大猩猩種群在不太遙遠的過去遭遇了瓶頸,但對新基因組進行分析的結果顯示這一瓶頸比以往認為的要更嚴重。
大猩猩基因組內的遺傳變異模式可以提供一些疾病、氣候改變、人類活動如何影響低地大猩猩種群的證據(jù)。
Eichler和他的研究小組在論文中寫道:“測序技術和計算生物學現(xiàn)在已進展至個體實驗室可以生成高質量哺乳動物基因組的階段。這種能力有望徹底改變我們對基因組進化和物種生物學的認識。”
Eichler補充說,這些進展還有可能大大推動對人類疾病遺傳基礎的研究,尤其是如果以這種方式測序更多的人類基因組。
“作為醫(yī)學研究者,如果我們只依賴短read序列,就如同我們的盔甲有裂隙。對大猩猩和其他人類基因組的研究工作清楚地證實了,采用短序列read方法無法理解大量的遺傳變異。長read測序使得我們能夠訪問以前看不到的遺傳變異新層面。”
上一篇: Science:首次確定寨卡病毒結構
下一篇: Nature子刊:解開蛋白質折疊的奧秘