《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 智能技術與生物技術共同繪就生命“藏寶圖”,對你我意味著什么?

智能技術與生物技術共同繪就生命“藏寶圖”,對你我意味著什么?

2021-07-01
來源:腦極體

  智能技術與生物技術,正在碰撞中萌生出激情的火花。

  2020年,全球人民都在盼星星盼月亮,盼著早日出現一支好疫苗。在這個過程中,AI前所未有地參與到基因測序、疫苗研發、生物醫藥等活動中來。而從英國變異病毒,到印度、南非等國出現變異毒株愈發嚴重,越來越多的人開始意識到,疫苗研發速度如果跟不上病毒變異的腳步,全球防疫成果會直接受影響。以此為契機,支撐高效研發的生物計算,也就各國重點關注并投入的科技賽道之一。

  AI對生物科學的影響,也獲得了學界的普遍認可與應用。在 “首屆中國生物計算大會” 上,著名結構生物學家施一公就從生命科學的角度,提出計算決定未來。

  那么,到底什么是生物計算,為什么說它會對國計民生至關重要?中國的生物計算發展究竟如何,未來又需要哪些產業要素?

  一首智能計算與生物技術相結合的產業協奏曲,已經在神州大地奏響,今天我們就化身一群最先“聞弦歌而知雅意”的人。

  邂逅的偶然與必然:AI給生物計算帶來了什么?

  簡單來說,生物計算指的是以生物大分子作為“數據”的計算模型。智能計算與生物技術的邂逅,似乎是疫情推動下的偶然事件,但如果我們將目光放得更長遠,從生物研發的歷史進程出發,會發現二者的結合其實是一場必然。

  有一個少有人知道的故事是,25年前,當時還在華爾街做程序員的李彥宏,就對生物信息倍感興趣,還收到了默克公司一個Bioinformatics(生物信息學)研究小組的offer。但受限于當時的生物數據量、成本、速度,計算的優勢很難發揮出來。

  而隨著時間的推移,基因組學研究帶來了人體數據增長、新藥研發過程當中積累的知識增長、各類機器學習算法的噴涌。這三個關鍵指標的變化,決定了當今的生物研發要考慮的不是該不該用AI的問題,而是用得上、用得好的問題。

  具體來說,生物計算能夠在三個領域里面釋放價值:

  1.新藥研發。

  對于病患來說,藥物就是生命。但長期以來,創新藥的研發普遍存在流程復雜、投入產出比低、傳統方法昂貴、耗時長等問題。傳統制藥研發平均周期都要10年左右,在當下生命科學信息指數級增加的背景下,更使得藥物研發的復雜度不斷攀升。

  這種情況下,依靠機器學習來識別新穎藥物、分析藥物結構等,能夠快速且低成本地完成蛋白質結構預測、藥物篩選、分子生成、ADMET預測等工作,從而大大提升新藥發現的效率,縮短新藥研發周期,直接降低研究成本。不僅能夠更快更廣泛地造福患者群體,而且能夠以技術為引擎,推動中國醫藥產業加速擁抱創新藥的發展機遇。

  2.疫苗設計。

  新冠疫苗的研發讓大家被科普了mRNA疫苗的強大。由于可在人體自身內生產抗原蛋白,制備速度快、無感染風險,mRNA疫苗也被MIT Technology Review評選為2021年“全球十大突破性技術”之一。

  但是,一個蛋白質所對應的mRNA序列有多種可能,隨著序列長度的增加,mRNA序列數量也會指數級增長,要設計出最穩定、蛋白質表達水平最高的mRNA序列并不容易。其中,AI的加入就至關重要了。

  比如百度在疫情期間相繼開源的LinearRNA系列算法,就利用AI算法和AI算力,在十數分鐘內就能夠計算設計出理論上的mRNA序列,讓緩慢高成本的疫苗設計流程大大加速。

  3.精準醫療。

  新興生物技術帶來越來越細顆粒度的數據,也使得精準藥物設計、個性化臨床診療及用藥等成為可能。試想一下,未來醫療服務可以精細到針對個體開發出個性化的靶向藥物,在疾病極早期就能夠進行綜合分析診斷和精準治療,真正實現“上醫治未病”的理想,毫無疑問會大大提升人們的健康生活質量。

  而要達到這一愿景的前提,或許就要將每個人的基因信息都提取出來,并進行分析挖掘處理計算,從而讓數據能夠有效應用到診斷當中,提供更適配的藥物選擇和治療方案。在這個過程中,利用AI算法讀懂數據必不可少。

  說到這里,大家想必能夠理解,為什么智能技術在今天必須與生物技術相結合,共同奏響生物計算的時代奏鳴曲,開啟全人類的健康新篇章。

  在這個領域當中,我們也看到了一批具有技術實力和社會責任感的科技巨頭們,扮演起了扛旗者的角色。比如谷歌DeepMind團隊研發的 AlphaFold 2算法,就曾震驚世人;中國AI公司百度,也在過去幾年里成立了生物實驗室、推出LinearRNA系列算法等。

  站在生物計算興起的關鍵節點,百度是如何思考與行動的,無疑是一次深入了解中國生物計算探索的契機。

  選定基調,生物計算何以成為百度的新坐標?

  在過去一年多的全球抗疫中,百度在生物計算領域交出了值得贊賞的答卷。

  2020年疫情爆發伊始,百度研究院就立即宣布向各基因檢測機構、防疫中心及全世界科學研究中心免費開放線性時間算法 LinearFold。公開數據顯示,LinearFold將當時新型冠狀病毒的全基因組二級結構預測從55分鐘縮短至27秒,提速120倍。

  隨后數月里,百度又連續與中國疾病預防控制中心聯合成立“”中國CDC應急技術中心-百度基因測序工作站“,后來北京新發地突發疫情,CDC工作站僅用10小時完成北京四個樣本的全基因組測序。

  2020年5月,百度又率先推出的全球首個 mRNA 疫苗基因序列設計算法 LinearDesign,大大提升疫苗設計的穩定性和蛋白質表達水平,助力疫苗研發;

  2020年8月,百度研究院正式成立了生物計算實驗室,期望通過人工智能和計算技術助力生物醫療發展。

  憑借RNA 結構預測與序列設計相關成果,百度也因此在 2020 年全球人工智能峰會(AISummit)上,獲得了 AI For Good(AI 向善)獎。

  經此一疫,不僅AI參與基礎生命科學研究的重要性進一步凸顯,生物計算也得以進入百度業務發展的主基調。如果說AI技術是百度在智能時代的殺手锏,那么生物計算則是助力未來增長的新航道。

  沒有積累,創新就是無本之木,更不可能快速展現出從實驗室到現實場景的技術貫穿力。這場百度戰疫,就得益于百度在生物計算上的布局由來已久。

  原來,早在2018年,百度研究院就開展了 RNA 結構預測和序列設計相關研究,并在2019年7月發表了前文中提到的 LinearFold算法。正是這些前期工作,讓百度可以在疫情爆發初期就快速響應,并在兩個月后就完成了mRNA 疫苗設計的革命性方法LinearDesign的研發。

  此外,百度在生物計算上的快速反應,也離不開飛槳和百度智能云在AI基礎設施上的積累與領先。

  過去幾年里,百度在底層計算硬件、深度學習框架、應用創新開發等領域都進行了全面部署與創新,其打造的 AI基礎設施也得以成為百度助力產業智能化升級的底座。有了這些基礎,才使得百度率先成為智能技術與生物技術相融合的橋梁。

  疫情讓全社會意識到了生物計算的重要性。接下來,吸引更多醫藥研發人員與開發者投入,才能真正推動產業共榮、造福社會。顯然,百度也認可這一趨勢,所以在2020年12月的Wave Summit深度學習開發者峰會上,正式發布了PaddleHelix螺旋槳生物計算平臺,在生物計算領域中向前一步。

  螺旋槳的蹄鳴:奏一支生物計算的交響

  歷史上有許多看似平常的一天,卻發生了意義非凡的事件。比如1953年2月28日,沃森與克里克在一個酒吧里宣布,他們發現了生命的奧秘——DNA的雙螺旋結構。

forward (2).jpg

  對于生物計算產業來說,百度生物計算平臺螺旋槳PaddleHelix的誕生,同樣是開創性的標志事件。它意味著有三個方面發生了變化:

  首先,是研發模式發生變化。區別于傳統的試管加電鏡式的研發模式,基于百度?槳深度性能優化和百度智能云的算力支撐,數據和算力不再成為生物醫藥研發等的制約因素,開始能夠被AI有效地發揮作用。

  舉個例子,傳統藥物研發中,需要合成大量的候選化合物來進行活性篩選,周期長且成功率低。而借助AI進行虛擬篩選,可以提前預測化學物的性質,從而加速研發流程。比如螺旋槳PaddleHelix 1.0新增的化合物預訓練模型 ChemRL,就使用深度圖神經網絡GNN來設計自監督學習任務學習化合物分子表示,效果出色。在國際權威榜單Open Graph Benchmark圖神經網絡基準 (OGB)上HIV和PCBA兩大數據集上,ChemRL拿下了雙冠軍。

  其次,研發門檻前所未有地降低。

  在醫藥領域,有標注的數據卻十分稀少,這就讓高質量的深度學習算法模型遭遇了瓶頸。百度螺旋槳PaddleHelix的創新在于,基于自身在NLP等AI相關領域的研發經驗,提出了生物醫藥領域的預訓練模型。先通過海量無標注數據的自監督學習,訓練出一個預訓練模型,相當于讓AI先學好通識課程;再根據多任務學習,對預訓練模型進行微調,能夠實現”專業能力“的快速提升,即便是在有限高質量數據的情況下,也能保證模型效果,從而極大地擴展了AI應用于生物研發的場景,更好地輔助研究人員的工作。

  另外,綜合性研發人才的短缺狀況得到緩解。

  同時擁有AI算法設計能力與藥物研發臨床醫學等專業背景的復合型人才,在今天是絕對的稀缺資源。人才培養無法一蹴而就,當下的研發進程也不容落后,這其中,螺旋槳PaddleHelix就延續了飛槳開源開放、零門檻AI的理念,將一系列生物計算的預訓練模型與工具,包括RNA二級結構預測、大規模的分子預訓練、藥物-靶點相互作用、以及ADMET成藥性預測等,覆蓋新藥研發和疫苗設計環節的核心能力。這些模型通過API接口,產業側研究人員只需要幾行簡單的代碼就能輕松調用,快速搭建計算任務,從而大大緩解了生物計算的”人才焦渴癥“。

  不難看到,螺旋槳PaddleHelix融合了百度多年在 AI 算力、算法上的積累,通過一整套工具、設施和服務,讓更多醫療工作者和生物科研人員也能夠靈活方便地應用AI,在藥物研發、疫苗設計和精準醫療等場景中釋放AI技術潛力。

  接下來,百度還將前往更大的產業舞臺去釋放生物計算的潛能。

  激昂樂章:百度的下一次大考

  從技術成熟走向普適的行業生長,需要更大舞臺、更多生態合作伙伴的協作。一條完整良性的生物科技產業鏈,才能源源不斷地激發出創新力。

  在這一點上,可以再一次看到百度的技術長期主義。與昔日成立研究院投身前瞻AI領域一樣,百度也在不斷加碼生物計算的投入與布局。

  尤其是在產業生態的支持上,”百圖生科“(英文名稱”BioMap“)正式成立,一方面為生命科學企業和科研用戶提供工具和解決方案,深度參與或主導發起新型精準藥物和精準診斷產品的研發,探索前沿生命科學的”無人區“。

  另一方面,則聚焦于孵化中國的生物計算產業生態。與提供新的數據軸和新的數據分析、藥物設計工具的初創企業與研究機構攜手,構建開放的生物計算創新生態。前不久,百圖生科宣布,將提供自身研發的核心生物計算引擎、海量自有數據、10億元的資金補貼,與聯盟伙伴共同打造國際領先的”免疫圖譜“。通過凝聚計算產業、AI領域、生物行業等不同領域的力量,共同為人類的終極健康福祉打造一艘未來方舟。

  無論人工智能還是生物計算,百度能夠在每一次國家戰略級科技競速中搶占先機,這件事聽起來難,做起來更難,可以總結為幾個原因:

  一是耐得苦寒的技術信仰。生物計算和AI一樣,需要長時間投入來形成技術優勢積累,而百度在研發領域的投入有目共睹。李彥宏曾表示,”在生命健康這個最關鍵的領域,哪怕投入再大、風險再高、周期再長,我們也要堅決地做。生命科學沒有盡頭,只有盡力“,百度在生物計算上持續投入的決心由此可見。

  二是尊重技術的落地節奏。和很多人幻想中”AI一出大殺四方“的途徑不同,技術落地也需要與產業需求、業務場景深入結合,百度在智能化進程中服務行業及企業的經驗能夠推動生物計算循序漸進、釋放紅利。

  三是利他的生態品牌。建立生態必須要贏得合作伙伴的信任,除了強大的技術研發創新能力,還要有開源開放的平臺價值、愿意承擔社會責任的利他心態,才能吸引中國醫藥生物產業界來攜手同行。

  當技術、產業、生態等一個個門檻被跨越,生物計算的前景自然也水到渠成。生物技術與智能技術這支協奏曲,也將經久不息地綿延下去。




mmexport1621241704608.jpg


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 一级啪啪片 | 荡公乱妇蒂芙尼中文字幕 | 最新精品在线视频 | 美女一级毛片免费观看 | 成人精品一区二区三区中文字幕 | 精品中文字幕在线 | 草草久久97超级碰碰碰免费 | 国产aⅴ一区二区 | 国产午夜精品久久久久免费视 | 欧美亚洲国产成人高清在线 | a天堂中文在线官网 | 国产色a | 老外一级毛片免费看 | 成人a视频片在线观看免费 成人a视频在线观看 | 99久久精品免费看国产免费软件 | 亚洲综合第一页 | 欧美成人高清视频 | 色青青草原桃花久久综合 | 日韩欧美亚洲中字幕在线播放 | 精品视频亚洲 | 国产孕妇孕交一级毛片 | 国产成人一区二区三区在线播放 | 天天五月天丁香婷婷深爱综合 | 中文字幕一区二区在线播放 | 久久九九精品视频 | 日韩乱淫 | 国产精品久久久久久久久久久威 | 久久精品成人国产午夜 | 特黄aaaaaa久久片| 亚洲欧美一区二区三区在线观看 | 国产美女作爱视频 | 日韩国产在线播放 | 欧美日韩一二区 | 免费一级特黄特色黄大任片 | 在线视频中文字幕 | 日本b站一卡二不卡 | 韩国免费特一级毛片 | 久久免费视频99 | 三级网站免费观看 | 日韩日韩日韩手机看片自拍 | 66精品 |