Sci Rep:PRC2與lncRNA相互作用的序列特異性新發(fā)現(xiàn)
日期:2017-02-14 09:04:04
國際學(xué)術(shù)期刊《科學(xué)報(bào)告》(Scientific Reports)近期在線發(fā)表了中國科學(xué)院-馬普學(xué)會(huì)計(jì)算生物學(xué)伙伴研究所邵振研究組關(guān)于PRC2與長非編碼RNA(lncRNA)之間相互作用的序列特異性研究成果。
由多梳(PcG)家族蛋白組成的表觀調(diào)控復(fù)合物PRC2是控制動(dòng)物組織發(fā)育的重要因子,但在高等動(dòng)物中PRC2如何被特異性招募到染色質(zhì)特定區(qū)域的分子機(jī)制還不清楚。隨著XIST與HOTAIR等PRC2結(jié)合lncRNA的發(fā)現(xiàn),人們猜測此類lncRNA可能決定了PRC2染色質(zhì)招募的特異性(Margueron et al. Nature 2011)。但是,直到現(xiàn)在PRC2與RNA結(jié)合是否具有序列特異性仍被廣泛爭論(Davidovich et al. Mol Cell 2015)。
邵振研究組首先開發(fā)了一個(gè)基于馬爾可夫鏈思想的序列組成分析流程,通過計(jì)算不同核苷酸間轉(zhuǎn)移在每條序列中出現(xiàn)的頻率來刻畫其組成,進(jìn)而選擇被特定序列所顯著偏好或不偏好的核苷酸間轉(zhuǎn)移作為它們的序列組成特征,并通過將所有可能的轉(zhuǎn)移映射到一個(gè)完整四叉樹來研究所選序列特征在特征空間中的分布是否具有非平凡性。通過將該流程應(yīng)用于人基因組中已知的數(shù)百個(gè)PRC2結(jié)合lncRNA,該研究系統(tǒng)分析了這些lncRNA的序列特征,發(fā)現(xiàn)其偏好的序列特征傾向在四叉樹上組成連續(xù)偏好路徑,并且這些連續(xù)路徑上的序列特征傾向于同時(shí)被人和小鼠基因組中的PRC2結(jié)合lncRNA所偏好。
受此啟發(fā),該研究整合小鼠胚胎干細(xì)胞中兩組已發(fā)表的RIP-seq和CLIP-seq數(shù)據(jù),定義了一組高可信度的小鼠PRC2結(jié)合lncRNA,發(fā)現(xiàn)這些lncRNA能夠被人基因組中已知PRC2結(jié)合lncRNA所具有的序列特征較好地預(yù)測。這些研究發(fā)現(xiàn)表明高等動(dòng)物中PRC2與lncRNA結(jié)合具有序列特異性,并且其特異性具有較高的跨物種保守性。此外,該研究還通過發(fā)展一個(gè)局域打分模型,發(fā)現(xiàn)PRC2結(jié)合lncRNA的序列特征在lncRNA上的分布表現(xiàn)出明顯的非隨機(jī)性。進(jìn)一步研究發(fā)現(xiàn),每個(gè)lncRNA上PRC2與lncRNA結(jié)合所偏好序列特征最富集的小片段(定義為PRC2偏好片段),相對(duì)lncRNA其它部分具有顯著更高的進(jìn)化保守性和RIP-seq信號(hào)強(qiáng)度(如圖),說明這些序列特征的局域富集具有明確的功能意義。
該項(xiàng)研究在研究員邵振指導(dǎo)下,由計(jì)算生物學(xué)研究所博士研究生涂世奇完成,并得到了中科院和上海市科委的經(jīng)費(fèi)支持,以及美國哈佛醫(yī)學(xué)院教授袁國丞的指導(dǎo)和協(xié)助。