2020年10月19日,國際學術期刊Nucleic Acids Research在線發布了中國科學院上海營養與健康研究所(中國科學院-馬普學會計算生物學伙伴研究所)王澤峰研究組與生物醫學大數據中心合作開發的專門提供各類支持環狀RNA (circRNAs)翻譯證據的數據庫TransCirc(https://www.biosino.org/transcirc/),該數據庫通過整合多種組學數據來預測特定環狀RNA編碼蛋白質的潛力并推斷其翻譯產物。文章題為“TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence”。
環形RNA是一類由反向剪接形成的具有共價閉環解構的RNA,在真核生物中具有廣泛表達且保守的特點。由于其序列與對應線性RNA大部分重合,因此可以天然通過結合miRNA或RNA結合蛋白(RBP)來調控親本基因的表達。近年來的研究發現,定位在細胞質中由外顯子構成的環形RNA也可以發揮類似mRNA的作用來指導蛋白質的翻譯,這類非帽依賴性翻譯通常在應激反應(如癌癥發生過程)中上調,是細胞在翻譯水平上改變應激反應途徑的重要表現。
隨著測序技術的發展,目前有大量的環形RNA被鑒定出來,與之不匹配的是為數不多的注釋數據庫,TransCirc就是針對這一需求構建的基于多組學證據的環狀RNA翻譯數據庫。目前,TransCirc中收錄了328080條人類環狀RNA信息和七類相關證據,其中:1) 核糖體譜(ribosome profiling)鑒定出與核糖體結合的環狀RNA共4284條;2) 含實驗鑒定的翻譯起始位點(TIS)、內部核糖體進入位點(IRES)和N-6-甲基腺苷修飾位點(m6A)的環狀RNA分別有10058、314111和40324條;3) 274762條環狀RNA含環狀RNA特有編碼框(ORF),其推斷翻譯產物中機器學習預測可形成穩定蛋白質和含質譜數據(MS)直接支持的分別有194927和168條。除以上數據外,TransCirc還提供了友好的搜索/瀏覽界面及輔助分析軟件。TransCirc作為研究環狀RNA翻譯能力及其編碼肽段功能的重要資源,未來將收錄更多相關組學數據并將擴展覆蓋到其他非人物種。
中國科學院上海營養與健康研究所王澤峰研究員和張國慶研究員為文章的共同通訊作者,黃文娣和凌鋆超為共同第一作者。上述研究工作得到了科技部國家重點研發計劃、中國科學院、國家自然科學基金委和上海市科學技術委員會等經費的支持。(科技處)
原文鏈接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa823/5930392

圖:TransCirc界面示例