1月15日,國際學術期刊Genomics, Proteomics & Bioinformatics在線發表了中國科學院-德國馬普計算生物學伙伴研究所楊力研究組關于環形RNA研究的最新進展“CIRCexplorer3: A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression”。該研究發布了升級版的環形RNA與線形RNA直接定量比較的分析系統CIRCexplorer3-CLEAR,用于開展環形RNA的精準定量研究。
真核生物中的反向剪接可以將外顯子序列反向首尾連接形成環形RNA。基于發現定位于反向剪接位點的高通量測序讀序,楊力研究組在2014年建立了高效的環形RNA計算分析新流程(CIRCexplorer, version 1),并通過合作系統揭示了環形RNA在體內的廣泛存在、揭示了互補序列介導的環形RNA產生基礎及其調控的普遍性規律(Zhang et al., Cell 2014)。開發的環形RNA計算分析流程CIRCexplorer被認為是在當時已有的環形RNA計算分析流程中預測效率和準確性最適的工具包(Hansen et al., Nucleic Acids Res 2016)。2016年,楊力研究組報道了升級版的CIRCexplorer2開源工具包,通過比較對應環形RNA和線性RNA的表達,全面闡述了環形RNA可變反向剪接(alternative back-splicing)和可變剪接(alternative splicing)的復雜性和多樣性,并建立了環形RNA數據庫網站http://www.picb.ac.cn/rnomics/circpedia(Zhang et al., Genome Res 2016;Dong et al., Genomics Proteomics Bioinformatics 2018)。但是,除了反向剪接位點以外,環形RNA與其對應的線形RNA在一級序列上完全重復,因此從轉錄組測序數據中系統發現環形RNA和線形RNA的策略不同。包括CIRCexplorer (version 1 and 2)在內,現有方法對環形RNA的全轉錄組檢測和定量主要依賴對跨反向剪接位點讀序的分析獲得FPM(fragments per million mapped fragments);而對線形RNA的定量分析則依賴覆蓋外顯子和跨外顯子的讀序以獲得FPKM(fragments per kilobase of transcript per million mapped fragments)。FPM和FPKM定量標準的不一致導致它們無法直接用來比較環形RNA及其對應線形RNA的表達。
在這項最新的研究中,楊力研究組開發了3.0版本的CIRCexplorer分析新流程用于環形RNA與線形RNA直接定量比較(https://github.com/YangLab/CLEAR),根據可被用于環形RNA與線形RNA直接定量比較的這一特性,這個新流程也被命名為CLEAR(circular and linear RNA expression analysis from ribosomal-RNA depleted RNA-seq)。在該最新的CLEAR流程中,研究人員定義并使用新的定量參數FPB(fragments per billion mapped bases)計算環形RNA與線性RNA的表達水平,主要通過計算跨反向剪接位點的讀序獲得環形RNA的表達(FPBcirc),同時計算跨正常剪接位點的讀序獲得線形RNA的表達(FPBlinear)。進一步,通過直接比較環形RNA及其對應線形RNA的FPB值獲得CIRCscore(FPBcirc vs FPBlinear),用來表征環形RNA相對于線形RNA的表達水平。相對于原有的FPM,新建立的FPB不受讀序長度與測序策略的影響,因此可以對來源于不同讀序長度、測序策略和測序深度的樣本進行比較;同時,新建立的CIRCscore能進一步去除線形RNA的表達背景對環形RNA進行相對定量,因此基于FPB和CIRCscore的定量分析將有更廣的適應性和更高的魯棒性。利用CIRCexplorer3-CLEAR,研究人員可篩選獲得相對于線形RNA高表達的環形RNA,并開展后續環形RNA功能及作用機制等研究。
楊力研究組長期從事核酸水平的組學及相關前沿新技術研究。在環形RNA研究領域,近期通過合作系統揭示了反向剪接環形RNA在生成加工、代謝降解、二級結構和生理功能等水平的調控及機制(Zhang et al., Cell 2014; Zhang et al., Cell Rep 2016; Zhang et al., Genome Res 2016; Dong et al., RNA Biol 2017; Li et al., Mol Cell 2017; Liu et al., Cell 2019)。該項研究成果在楊力研究員指導下完成,受到了中國科學院、國家自然科學基金委和Howard Hughes Medical Institute International Program的基金的支持。楊力研究組2014級碩博連讀研究生馬旭凱為第一作者,研究獲得了生化細胞所陳玲玲研究員及其研究組、康涅狄格大學Gordon G. Carmichael教授的大力支持。(科技處)
論文網址:https://doi.org/10.1016/j.gpb.2019.11.004

圖1: CIRCexplorer3-CLEAR分析新流程用于環形RNA與線形RNA直接定量比較