中國基因組測序成果登Nature子刊
日期:2012-05-15 08:16:55
來自深圳華大基因研究院,張家口市農(nóng)業(yè)科學(xué)院,丹麥哥本哈根大學(xué)的研究人員發(fā)表了題為“Genome sequence of foxtail millet (Setaria italica) provides insights into grass evolution and biofuel potential”的文章,最新完成了一種植物:谷子(foxtail millet,學(xué)名Setaria italica)的全基因組測序,谷是目前種植第二廣泛的粟類物種,這項(xiàng)研究為提高谷類糧食遺傳性狀提供了寶貴的資源。相關(guān)成果公布在5月13日Nature Biotechnology雜志上,目前這一論文免費(fèi)開放。
文章的通訊作者分別是深圳華大基因的汪建和王俊兩位研究員,以及張家口市農(nóng)業(yè)科學(xué)院的趙治海研究員。第一作者為華大基因研究院副院長張耕耘研究員等人,張耕耘表示,“這一全基因組序列的解析,是揭示作物遺傳調(diào)控奧秘的關(guān)鍵步驟,也是生物學(xué)研究和育種的一個(gè)重要平臺(tái)?!?/SPAN>
谷子基因組
谷子又稱為粟,去殼后稱為小米。谷子起源于我國,已有7000年栽培歷史,是傳統(tǒng)的優(yōu)勢作物、主食作物、抗旱耐瘠作物,在中華悠久的文明史上發(fā)揮了重要作用。然而,谷子的主產(chǎn)區(qū)多為干旱少雨的貧困地區(qū),產(chǎn)量低一直是困擾谷子生產(chǎn)的最大難題。在一些山區(qū)、半山區(qū)只能以種谷為生的農(nóng)民們,祖祖輩輩種著畝產(chǎn)不足70公斤的谷子,苦苦地掙扎在貧困線上。
“傳統(tǒng)品種的低產(chǎn)量極大的限制了谷子的種植和利用”,張耕耘說,“張家口市農(nóng)業(yè)科學(xué)院的趙治海研究員近年來培育出了雜家品種,將谷子的產(chǎn)量提高了一倍。我希望這項(xiàng)研究成果能作為一個(gè)范例——應(yīng)用基因組序列,更好的理解,更快的培育出之前被忽視的農(nóng)作物,具有更高產(chǎn)量的,質(zhì)量更好,耐受性更強(qiáng)的新品種?!?/SPAN>
在這項(xiàng)研究中,研究人員利用新一代測序技術(shù),對(duì)一種國內(nèi)北部谷子品系:張谷(Zhang gu)進(jìn)行了從頭測序(de novo assembly),獲得了大小約為423Mb(N50達(dá)到了1.0Mb),包含38,801個(gè)蛋白編碼基因的全基因組序列,這些基因預(yù)測超過81%已經(jīng)表達(dá)。通過基因組注釋和分析發(fā)現(xiàn),谷子基因組中的重復(fù)序列約占整個(gè)基因組的46%。
除此之外,研究人員還對(duì)另一谷子品系A2進(jìn)行了重測序——A2是一種廣泛使用的谷子雜交雌株品系,利用這兩個(gè)品系親本F2代群體,完成了高密度遺傳連鎖圖譜。
基因組數(shù)據(jù)分析比對(duì)
通過將谷子基因組與水稻基因組進(jìn)行比對(duì),研究人員發(fā)現(xiàn)了谷子染色體的進(jìn)化規(guī)律和變化趨勢,這對(duì)于了解這一農(nóng)作物的進(jìn)化具有重要意義。“我們發(fā)現(xiàn)九種谷子染色體是在三個(gè)染色體重組事件后形成的”,張耕耘說,“這三個(gè)事件,其中兩個(gè)出現(xiàn)在谷子從水稻分化之后,接下來在谷子從高粱分化之后,又出現(xiàn)了一次染色體重排?!?/SPAN>
相比于C3植物(如水稻和小麥),C4植物具有更高的水分利用效率和光合效率,以及抗旱能力。谷子就是一種二倍體C4植物,利用其基因組序列數(shù)據(jù),研究人員能更全面的分析C4光合作用途徑的幾種關(guān)鍵基因,結(jié)果他們發(fā)現(xiàn)在C4碳固定途徑中出現(xiàn)的基因,也出現(xiàn)在了C3植物中,因此研究人員推測C4途徑可能是由于調(diào)控表達(dá)的差異所引起的功能上的改變導(dǎo)致的。
谷子基因組序列的繪制完成,有利于分析作物數(shù)量性狀位點(diǎn),在這項(xiàng)研究中,研究人員就利用谷子基因組幫助鑒定了抗除草劑基因,并且精確識(shí)別出了抗稀禾定性狀相關(guān)的基因,印證了之前研究表明的一個(gè)單核苷酸突變位點(diǎn)(SNP)可能是導(dǎo)致植株對(duì)稀禾定敏感性發(fā)生改變的結(jié)論。
測序方法
這項(xiàng)研究采用了全基因組鳥槍法-新一代測序方法,來組裝繪制這一基因組圖譜。測序采用的是Illumina第二代測序儀(Illumina Genome Analyzer II以及HiSeq 2000,分別負(fù)責(zé)短插入片段文庫和長插入片段文庫 ),數(shù)據(jù)過濾后,研究人員將約40Gb的數(shù)據(jù)呈遞給SOAPdenovo。