近期,華為與昌平實驗室、北京大學生物醫學前沿創新中心(BIOPIC)和化學與分子工程學院、深圳灣實驗室高毅勤教授課題組及鵬城實驗室陳杰團隊基于全場景AI框架昇思MindSpore開發的蛋白質結構預測模型,在全球持續蛋白質結構預測競賽CAMEO(Continous Automated Model EvaluatiOn)獲得全球第一的好成績。這顯示出昇騰AI基礎軟硬件平臺在 AI+科學計算 領域的強大能力。
4月21日最新月榜競賽結果
超越業界標桿,連續三周保持全球第一排名
蛋白質結構預測是人工智能走進生命科學的關鍵成果之一,對生物學研究意義重大。2020年12月,《科學》雜志評選了該年度十個重大科學突破,蛋白質結構預測的人工智能AlphaFold就是其中非常重要的一項,因此AlphaFold成為生物研究領域的標桿成果,更是一塊重要里程碑。
昇思MindSpore蛋白質結構預測模型研發進展
2021年11月,華為昇思MindSpore團隊與昌平實驗室、北京大學生物醫學前沿創新中心(BIOPIC)和化學與分子工程學院、深圳灣實驗室高毅勤教授課題組聯合推出基于AlphaFold2算法的蛋白質結構預測推理工具,并在2022年2月實現訓練的全流程打通,效率同比提升2-3倍。
采用昇騰AI基礎軟硬件平臺后,在混合精度下,單步迭代時間由20秒縮短到12秒,性能提升超過60%。依托昇思MindSpore內存復用能力,訓練序列長度由384提升至512。
在訓練精度接近AlphaFold2的基礎上,昇思MindSpore在算法、規模和軟硬件支持等方向上持續改進,本次發布的蛋白質結構預測模型成績持續刷新業界記錄、拿下CAMEO競賽第一,是昇思MindSpore在蛋白質結構預測領域的又一里程碑,在填補國產人工智能基礎軟硬件在蛋白質結構預測領域成績空白的同時,更加證明了其價值與優越性。
由瑞士生物信息研究所和巴塞爾大學聯合舉辦的 CAMEO(Continous Automated Model EvaluatiOn)——全球持續蛋白質結構預測競賽,被認為是蛋白質結構預測領域最重要的比賽之一。CAMEO 競賽的規則是,每位參賽者需每周對 20 個由世界范圍內的結構生物學家最新破解出的蛋白質結構進行預測,其分數和名次每周都會進行在線更新。
該競賽吸引了眾多世界范圍內生物計算領域的前沿模型“選手”基于昇思MindSpore AI框架訓練的蛋白質結構預測模型,一經亮相,便領跑全球。在最近的三周CAMEO競賽中持續排名第一,意味著昇騰AI基礎軟硬件平臺在AI for Science領域的強大能力。
未來,針對蛋白質結構預測問題,昇思MindSpore將攜手學術科研界更多合作伙伴,在蛋白質結構預測領域共同探索、持續突破,助力國內相關基礎研究,尤其是生命各分支學科的進步,推動創新制藥行業的發展。