9月10日下午,中國科學院上海營養(yǎng)與健康研究所所級科學數(shù)據(jù)中心舉辦了“生物醫(yī)學命名實體識別及消歧”培訓,旨在幫助科研人員了解和掌握生物醫(yī)學命名實體識別及消歧技術。本次培訓由中心莊心昊博士擔任主講人。
莊心昊首先以新型冠狀病毒數(shù)據(jù)為例,詳細講解了生物醫(yī)學命名實體識別的概念和基本原理及其重要性。他指出,通過命名實體識別消歧,可以實現(xiàn)高效的信息檢索。培訓中,莊心昊介紹了UMLS、BERN、MetaMap等生物醫(yī)學特有的術語庫和工具,并探討了命名實體識別完成后可以進行的一些應用,例如構建知識圖譜和提供用藥建議。此外,他還講解了如何從大量文本中定位實體,從而更全面地理解實體之間的關系,并探討了命名實體識別消歧在臨床實驗中的應用。最后,莊心昊分享了所級科學數(shù)據(jù)中心在命名實體識別消歧方面的研究成果,包括大模型NER方法、抗原肽識別及文本訓練,同時他還對中心開發(fā)中的標注系統(tǒng)進行了展示。
培訓過程中,學員們積極參與,踴躍發(fā)言,并與主講人進行了深入交流和討論。討論內容涵蓋了傳統(tǒng)文本識別與大模型時代的區(qū)別、如何確定實體的來源、區(qū)分實體和屬性、以及不同階段在消歧中的關注點。
營養(yǎng)與健康所所級科學數(shù)據(jù)中心將持續(xù)舉辦相關主題的培訓活動,以幫助更多的科研人員了解中心提供的保全、保供、增值、定制等四類服務。同時,所級科學數(shù)據(jù)中心還設計了相關的調研問卷(詳見文末二維碼),誠邀科研人員提出寶貴的意見和建議,以便進一步優(yōu)化和提升服務質量。通過與科研人員的積極互動和反饋,中心將不斷改進服務流程,提升技術支持質量,為進一步滿足科研需求提供更加優(yōu)質的服務。

莊心昊博士作培訓報告