近日,國際學(xué)術(shù)期刊Biosafety and Health在線發(fā)表了中國科學(xué)院上海營養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心張國慶研究團(tuán)隊的論文“An explainable artificial intelligence framework reveals mutations associated with drug resistance in Mycobacterium tuberculosis”。研究團(tuán)隊開發(fā)了一種名為xAI-MTBDR的可解釋人工智能框架,基于近4萬株結(jié)核分枝桿菌全基因組測序數(shù)據(jù),不僅實現(xiàn)了耐藥性的高精度預(yù)測,還系統(tǒng)揭示了潛在耐藥新位點及其可能的分子機(jī)制,為結(jié)核病的精準(zhǔn)診斷與治療提供了新的技術(shù)工具。
結(jié)核病是由結(jié)核分枝桿菌(Mycobacterium tuberculosis, MTB)引起的全球性細(xì)菌傳染病,2023年全球約有1060萬新發(fā)病例并導(dǎo)致130萬人死亡。耐藥結(jié)核病的出現(xiàn)顯著降低了治療成功率,進(jìn)一步加劇了結(jié)核病防控的難度。近年來,機(jī)器學(xué)習(xí)方法已被用于從基因組數(shù)據(jù)中識別與耐藥相關(guān)的復(fù)雜模式,但現(xiàn)有研究多停留在群體層面的統(tǒng)計關(guān)聯(lián),缺乏對單個菌株耐藥機(jī)制的可解釋性分析,而這一層面的解析對于理解特定突變?nèi)绾谓閷?dǎo)耐藥具有關(guān)鍵意義。因此,亟需能夠同時提供群體層面“全局解釋”和個體層面“局部解釋”的預(yù)測模型:前者用于系統(tǒng)評估突變對耐藥性的整體貢獻(xiàn),后者用于揭示具體菌株耐藥表型的關(guān)鍵驅(qū)動因素。
基于此,研究團(tuán)隊構(gòu)建了可解釋人工智能模型xAI-MTBDR,通過集成多種機(jī)器學(xué)習(xí)模型與SHAP方法,旨在識別新的耐藥相關(guān)突變并準(zhǔn)確預(yù)測MTB的藥物耐藥性。利用包含39,145株MTB分離株的公共數(shù)據(jù)集進(jìn)行評估,xAI-MTBDR在預(yù)測所有一線抗結(jié)核藥物耐藥性方面表現(xiàn)優(yōu)于當(dāng)前最先進(jìn)的方法,并能對每個突變在耐藥性中的貢獻(xiàn)進(jìn)行量化評分。模型的預(yù)測結(jié)果與世界衛(wèi)生組織發(fā)布的MTB耐藥突變目錄高度一致,驗證了其廣泛的適用性與可靠性。在個體層面,xAI-MTBDR能夠解析突變對每一株分離株耐藥的貢獻(xiàn)。本研究共發(fā)現(xiàn)27個潛在的耐藥標(biāo)志物,其中部分突變在蛋白質(zhì)三維結(jié)構(gòu)中比已知耐藥突變更接近對應(yīng)藥物的結(jié)合位點,提示其可能在介導(dǎo)耐藥性中發(fā)揮更直接的作用。此外,基于貢獻(xiàn)評分,該框架可對分離株進(jìn)行有效亞群劃分,反映其耐藥程度的差異。
綜上,xAI-MTBDR為耐藥結(jié)核分枝桿菌的精準(zhǔn)檢測提供了有力工具,并為理解耐藥機(jī)制提供了群體與個體層面的新視角。隨著全基因組測序與耐藥表型數(shù)據(jù)的不斷積累與完善,整合可解釋人工智能方法有望進(jìn)一步提高預(yù)測準(zhǔn)確性,深化對耐藥機(jī)制的理解,優(yōu)化臨床治療策略,從而為降低耐藥結(jié)核病及其他病原體感染所致的疾病負(fù)擔(dān)提供支持。
中國科學(xué)院上海營養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心張國慶研究員和趙國屏院士為論文共同通訊作者;博士研究生岑卉、生物醫(yī)學(xué)大數(shù)據(jù)中心副研究員張鵬和高級工程師凌鋆超為論文共同作者。該研究得到了科技部國家重點研發(fā)計劃、上海市科技創(chuàng)新行動計劃、廣州國家實驗室研發(fā)計劃等項目的資助。

圖:可解釋性結(jié)核耐藥分析模型xAI-MTBDR示意圖
論文鏈接:https://doi.org/10.1016/j.bsheal.2025.11.001
推送單元:張國慶研究組、科技規(guī)劃與任務(wù)處