Nature Methods新方法能矯正RNA-seq測序的技術偏差
日期:2017-03-09 08:50:44
基因表達分析正越來越多地用于癌癥的診斷和檢測,是生物學研究的主要工具,一種新型的計算方法可以提高基因表達分析的準確性。
來自卡耐基梅隆大學和紐約州立大學石溪分校的研究人員稱,他們的方法(被稱作Salmon)能夠矯正轉(zhuǎn)錄組測序技術(RNA-seq)中的技術偏差。而且這種技術預估基因表達水平的速度也與其它快速方法相當。
他們的方法已發(fā)表于3月6日的Nature Methods雜志,并且Salmon的資源代碼已經(jīng)被成千上萬的用戶免費下載。
來自卡耐基梅隆大學計算生物學系的助理教授Carl Kingsford說,Salmon為RNA-seq實驗及其可能存在的偏差提供了更豐富的計算模型。為這種技術越來越多的應用于疾病和其壓型的分類、了解發(fā)育過程中的基因表達變化、以及跟蹤癌癥的進程等提供了重要的保障。
盡管生物體基因的構(gòu)成是靜態(tài)的,但是個體基因的活動是隨著時間的推移而變化的,這使得基因表達成為理解生物體工作方式,以及疾病過程中發(fā)生了什么,的重要指標?;虻幕钚噪m然不能被直接測量,但可以通過監(jiān)視RNA來進行推斷。
RNA-seq是目前捕捉基因活性的領先技術。但是,根據(jù)由于不同組織、不同制備方法、不同實驗誤差,導致RNA-seq的讀數(shù)也會比實際偏高或偏低。
雖然我們知道會存在許多偏差,但是在對它們建模時還是會發(fā)生樣品循序的偏差。為此,倘若你準備用傳統(tǒng)的方法建立一個更復雜的偏差模型,那將是非常耗時的。
Salmon結(jié)合了一個新的雙相位并行推理算法、功能豐富的偏差模型,以及超快速讀取映射程序。這是第一個能正確測量GC片段偏差的,全轉(zhuǎn)錄組水平測量技術,能大幅度提高豐度估值的準確性以及差異表達分析的靈敏度。
Salmon算法得名于一種擅長逆流而上的魚——鮭魚。當實驗數(shù)據(jù)“流過”時,該種算法可以直接估計出偏差的影響和基因表達水平。因此,它可以像其他快速分析工具一樣,迅速而準確地得知基因表達水平。
上一篇: PNAS:何時開始生育,要看這個因子