構(gòu)建詳細(xì)全面的染色體互作圖
日期:2012-10-08 07:50:18
染色體構(gòu)象捕獲(3C)技術(shù)正在改變我們對(duì)于基因組空間組織構(gòu)架的理解。然而目前推測(cè)染色質(zhì)相互作用,卻受限于兩個(gè)方面的困難:其一是生成高分辨率信號(hào),其二是從多個(gè)背景來(lái)源中分辨信號(hào)。
近期兩項(xiàng)最新的研究報(bào)道了這些方面的技術(shù)進(jìn)展,第一篇文章描述了一種高分辨率4C-seq 新型工作流程和計(jì)算通道,第二篇?jiǎng)t報(bào)告一種新策略,能同時(shí)消除Hi-C數(shù)據(jù)中多個(gè)背景來(lái)源。
上篇: 兩篇Nature技術(shù)文章介紹基因組組織
重要的是,為了能最大限度地增加互作片段的數(shù)目,研究人員兩輪消化采用的是具有四種堿基特異性的限制性內(nèi)切酶,從而可用片段池中的片段數(shù),相較于之前采用的six-base切斷法提高了十倍。
可能會(huì)有人認(rèn)為減少片段大小就足以提高分辨率了,但是更高的分辨率也意味著更多的背景誤差。比如說(shuō),4C-seq技術(shù)降低了初次限制性片段的平均長(zhǎng)度,也就相應(yīng)的增加了不包含二次限制性酶切位點(diǎn)片段的初次片段比例。所以最終的溶液里有消化了兩次的一些片段,也有只消化了一次的片段。由于PCR擴(kuò)增對(duì)于較短的片段更有效,因此讀取數(shù)據(jù)就會(huì)出現(xiàn)系統(tǒng)誤差。
此外,實(shí)驗(yàn)覆蓋率也會(huì)受到其它多個(gè)誤差的影響,包括限制性內(nèi)切酶的效率和基因組測(cè)序片段的可作圖性,所以說(shuō)改進(jìn)實(shí)驗(yàn)需要兩手抓,需要更加嚴(yán)格的統(tǒng)計(jì)學(xué)處理,消除數(shù)據(jù)誤差的影響。
Werken等人提出了一種糾正誤差的計(jì)算機(jī)框架,他們將限制性片段根據(jù)相似特性進(jìn)行分類,比如GC含量和片段長(zhǎng)度,期間采用兩個(gè)互補(bǔ)的策略,糾正接觸強(qiáng)度。對(duì)于遠(yuǎn)程相互作用,研究人員預(yù)計(jì)了每個(gè)片段類的覆蓋背景率,分別計(jì)算各類觀察到的和預(yù)期的片段覆蓋之間的富集。而對(duì)于近程相互作用,研究人員又采用了另外一種不同的方法,因?yàn)榻佑|范圍隨著序列距離變化大。但是因?yàn)椴煌晤惖母采w譜代表著相同的相關(guān)分布,所以研究人員能在位數(shù)正?;筮M(jìn)行比較。
研究人員通過(guò)三個(gè)不同的基因位點(diǎn)驗(yàn)證了這種技術(shù),這三個(gè)位點(diǎn)分別是β-珠蛋白,Oct4和SATB1。他們?cè)?/SPAN>150kb β-珠蛋白區(qū)域中檢測(cè)了大約1,000片段末端,將其與以前的實(shí)驗(yàn)報(bào)道進(jìn)行比較,進(jìn)一步證明了同一位點(diǎn)上全基因組范圍內(nèi)的互作圖譜具有高度重現(xiàn)性。這些實(shí)驗(yàn)表明高清晰度4C-seq是一種全基因組范圍內(nèi),篩選包含目標(biāo)啟動(dòng)子在內(nèi)的調(diào)控DNA元件,強(qiáng)大有效的直接方法。
第二篇文章“Iterative correction of Hi-C data reveals hallmarks of chromosome organization”,是由麻省理工的Mirny和Dekker研究組完成,主要聚焦于低分辨率所有區(qū)域中的全基因組范圍相互作用。
與4C-seq方法一樣,HI-C數(shù)據(jù)也受到多個(gè)技術(shù)和生物學(xué)來(lái)源誤差的影響,要糾正這些誤差很困難,不僅是因?yàn)楸仨氼A(yù)料到所有可能的誤差來(lái)源,而且還由于某種誤差的大小和方向會(huì)根據(jù)不同實(shí)驗(yàn)方法而變化。
為了應(yīng)對(duì)這一挑戰(zhàn),Imakaev等人開(kāi)發(fā)出了一個(gè)集成方案,可以在未知這些技術(shù)或生物來(lái)源的前提下,消除Hi-C數(shù)據(jù)中的許多誤差。換句話說(shuō),通過(guò)一種無(wú)偏差方式消除了誤差。
Imakaev這篇文章的核心假設(shè)是,在一個(gè)無(wú)誤差實(shí)驗(yàn)中,所有的基因組區(qū)域應(yīng)該通過(guò)同一“可見(jiàn)性”進(jìn)行分析,這樣實(shí)驗(yàn)中觀察到基因組區(qū)域的概率就相同了。而且作者假設(shè)每對(duì)相互作用的可見(jiàn)誤差是會(huì)消失的,也就是說(shuō),這種偏差是隨著相互作用的兩個(gè)區(qū)域各自作用區(qū)域出現(xiàn)的誤差而出現(xiàn)的。
在這些假設(shè)的基礎(chǔ)上,Hi-C原始計(jì)數(shù)矩陣可以反復(fù)驗(yàn)證,在一個(gè)重復(fù)循環(huán)中,Hi-C圖譜的每一組分都能通過(guò)兩個(gè)互作區(qū)域的可見(jiàn)誤差產(chǎn)物區(qū)分開(kāi)來(lái)。同樣,Imakaev等人也在人淋巴母細(xì)胞系實(shí)驗(yàn)中驗(yàn)證了這種方法,獲得結(jié)果出現(xiàn)的誤差與近期概率方法計(jì)算出來(lái)的限制性片段水平誤差相關(guān)性很好,從而相互確認(rèn)了這兩種方法的作用。
從這兩篇論文中,我們可以看到染色質(zhì)互作圖譜實(shí)驗(yàn)技術(shù)與分析方法上的極大進(jìn)步,這些成果將有助于科學(xué)家們深入了解基因組的三維結(jié)構(gòu),極大地改變我們對(duì)于人類基因組全圖的認(rèn)識(shí)。