Nature子刊:如何利用癌癥研究數(shù)據(jù)
日期:2014-11-04 08:48:51
故事的一開始很簡單:Nate Silver(著名統(tǒng)計學(xué)家) 和Richard Feynman(著名物理學(xué)家)走進(jìn)一家酒吧,撞上了一位生物學(xué)家……
雖然接下來要講述的可能有些書呆氣,令人覺得煩悶,但是在現(xiàn)代生物學(xué)領(lǐng)域,已經(jīng)出現(xiàn)了越來越多這樣的故事,多學(xué)科多領(lǐng)域的研究人員聚在一起,頭碰頭在海量的基因組數(shù)據(jù)中尋找意義。
然而即使如此,當(dāng)我們面對正在以驚人的速度增多的癌癥突變數(shù)據(jù)時,依然令我們頭皮發(fā)麻,無從下手,現(xiàn)在的挑戰(zhàn)就是找到一種有效的方法,能從多種噪音背景中發(fā)現(xiàn)信號。
近期一組研究人員迎難而上,聚合多學(xué)科的力量,尤其是統(tǒng)計物理學(xué)以及人工智能,開發(fā)出了一種將癌癥突變數(shù)據(jù)轉(zhuǎn)變成多維模型的新方法,這種多維模型能展現(xiàn)出特殊的突變對細(xì)胞中蛋白社會性網(wǎng)絡(luò)產(chǎn)生的影響。從中研究人員就能推斷出癌細(xì)胞中的無數(shù)突變在致病過程中的實(shí)際功能。
“我們聚焦于統(tǒng)計力學(xué)中的一個基本概念,這個概念我們在本科的理論物理課程中就學(xué)過,但是之后由于其不適用于我們的日常生活,因此就被遺忘了。但是作為生物學(xué)家,這一概念能幫助我們解決癌癥遺傳學(xué)中最困難的一個問題,”文章的通訊作者,哈佛醫(yī)學(xué)院系統(tǒng)藥理學(xué)教授Peter Sorger說。
這一研究成果公布在11月2日Nature Genetics雜志上。
目前許多被廣泛研究的癌基因,如p53、Ras等都是多個研究組通過多年的努力而發(fā)現(xiàn)的,但是時至今日,我們進(jìn)入了高通量基因組學(xué)時代,可以從成千上萬的樣品中獲得數(shù)千倍更多的數(shù)據(jù),因此累積至今的癌癥突變數(shù)據(jù)巨大。
但是并不是所有的突變都會影響腫瘤行為,實(shí)際上許多只不過搭搭順風(fēng)車而已,這些突變被稱為“乘客突變(或偶發(fā)突變,passenger mutations)”。為了能將“司機(jī)突變,或主導(dǎo)突變”與偶發(fā)突變區(qū)分開來,研究人員常常會利用一種“輪詢polling”策略,識別最常見的突變,推理哪些是重要的。然后對最重要的候選突變進(jìn)行詳盡細(xì)致的分析,像是p53,Ras此類的研究。
這篇文章的第一作者Mohammed AlQuraishi是一位具有遺傳學(xué),統(tǒng)計學(xué)和物理學(xué)背景的研究學(xué)者,他意識到生物學(xué)能從統(tǒng)計學(xué)和物理學(xué)中受益良多,他開玩笑說:“這就像是Silver 和 Feynman 在一起工作。”
AlQuraishi利用他的平臺分析癌癥基因圖譜中數(shù)據(jù),結(jié)果獲得了大量詳細(xì)的原理注釋圖,可以用來解釋某些突變能改變蛋白復(fù)雜大量的細(xì)胞內(nèi)網(wǎng)絡(luò),這一網(wǎng)絡(luò)在很大程度上覺得了細(xì)胞的健康狀態(tài)。
從中AlQuraishi發(fā)現(xiàn)常見和罕見的突變其實(shí)都會影響蛋白網(wǎng)絡(luò)。“這兩種突變同樣重要。在這兩種情況下,大約有 1%的常見突變和1%罕見突變改變腫瘤網(wǎng)絡(luò)。但罕見突變基本上被忽略,現(xiàn)在我們要多注意它們。”
出現(xiàn)每一個常見突變,就會有大約四個罕見突變,因此從數(shù)量上來說,罕見突變可能比之前我們所認(rèn)為的更加重要,“我們一直認(rèn)為大量的罕見突變是暗物質(zhì),但在這項(xiàng)研究中,我們發(fā)現(xiàn)這些暗物質(zhì)發(fā)揮著作用。”