機器之心原創(chuàng)
作者:李澤南
人工智能(AI)有可能通過幫助人類醫(yī)療專家進行高難度分類、快速分析大量醫(yī)療圖像的方式徹底改變疾病的診斷和治療流程。近日,由加州大學圣地亞哥分校張康教授等人提出的深度學習診斷方式讓我們提前看到了未來。
2018 年 2 月 22 日出版的《Cell》封面文章介紹了由加州大學圣地亞哥分校(University of California, San Diego)張康教授主導的研究成果:一種基于遷移學習,能夠精確診斷致盲性視網膜疾病與肺炎的人工智能工具。該方法的表現(xiàn)與專業(yè)醫(yī)生能力相當,并可以在 30 秒內確定患者是否應接受治療,準確度高達 95%以上;在區(qū)分病毒性肺炎和細菌性肺炎上,新方法的準確率也超過了 90%。同時,該研究也通過顯示神經網絡激活區(qū)域的方法向人們提供了機器診斷的可解釋性。作為中國學者主導的又一項重要研究,該文章發(fā)表以后受到了人們的廣泛關注。
論文鏈接:http://www.cell.com/cell/fulltext/S0092-8674(18)30154-5
該研究的主要推動者張康,是加州大學圣地亞哥分校眼科教授、眼科遺傳學主任,中國第三批「千人計劃」入選者,四川大學客座教授。他曾在四川大學獲得生物化學學士學位,哈佛大學醫(yī)學博士學位(Magna Cum Laude 榮譽),麻省理工學院(MIT)聯(lián)合醫(yī)學博士學位及哈佛大學遺傳學博士學位。張康在約翰霍普金斯大學 Wilmer 眼科研究所完成了眼科住院醫(yī)生實習期,并曾在猶他大學完成視網膜手術??朴柧殹?/p>
張康教授的臨床和研究重點是重大疾病的基礎和轉化研究,尋找新的基因靶標和治療方法。
他曾在許多著名學術期刊上發(fā)表或共同撰寫了超過 200 篇同行評議論文,其中涵蓋遺傳學、分子生物學、干細胞、腫瘤液體活檢、3D 打印及組織工程、人工智能和臨床試驗等多個領域。其中關于 HTRA1 基因是黃斑變性的主要易感基因的《Science》文章曾被這家期刊評為 2006 年世界科學十大進展之一。
在《Cell》上的文章發(fā)表之后,機器之心對張康教授進行了專訪,我們與他對遷移學習、跨學科研究、AI 在醫(yī)療領域應用等問題進行了交流。
機器之心:發(fā)表在《Cell》上的論文《Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning》,該研究是從何時開始啟動的?
張康:我很早就有這個想法了,真正啟動是在去年(2017 年)初。
機器之心:作為眼科教授,使用計算機科學領域中也是剛剛發(fā)展起來的機器學習工具進行研究,會遇到哪些困難?
張康:生物醫(yī)療科學和計算機科學是兩個完全不同的領域。由于計算機科學的高速發(fā)展,我們面臨的首要問題就是學習并結合這些最近開發(fā)的深度學習技術,以確保我們的研究對當前和未來的計算機視覺研究及應用是相關和有用的。深度學習引入可取代之前技術的新方法而改變了計算機視覺領域。然而,這個項目的主要挑戰(zhàn)是獲得大量的 OCT 圖像,并組織一個龐大而結構化的視網膜專家體系,以確保盡可能準確地標記大數(shù)據(jù),另外我們必須組織一個優(yōu)秀人工智能小組。
機器之心:新研究的圖像識別模型對計算機的算力要求有多高?
張康:該模型在 4 個 GTX 1080 8GB GPU 中進行了訓練和測試。但是,由于該模型是使用預訓練權重進行訓練的,從而使訓練時間比訓練空白神經網絡要少得多。因此,還可以在合理的時間內使用更小的 GPU 甚至多個 CPU 來完成此模型的訓練和推理。
機器之心:神經網絡的推理是一個「黑箱」,你們提出的新方法是如何解釋計算機作出「診斷」的依據(jù)的?
張康:我們在視網膜 OCT 圖像的研究中加入了「遮擋測試」——通過卷積一個遮擋核心到輸入圖像上,機器會通過計算預測做出正確診斷最可能的部位,并輸出含有高亮色塊的「遮擋」圖,這些色塊就是 AI「認為」的病變部位,得出直觀的為臨床醫(yī)生信任的診斷依據(jù)。
機器之心:神經網絡在識別醫(yī)療圖像時相比人類醫(yī)生具有哪些優(yōu)勢?
張康:首先,通過輸入大量的數(shù)據(jù),神經網絡可以獲得遠超過人類醫(yī)生的「經驗」,計算出超越人類的準確結果,在我們的系統(tǒng)中,我們使用超過 20 萬張醫(yī)學圖像,通過不同的疾病分類,最終使用近 11 萬張視網膜 OCT 圖像訓練機器。在眼病方面,能在 30 秒內正確鑒別脈絡膜新生血管、糖尿病黃斑水腫、玻璃膜疣以及正常視網膜的 OCT 圖像,結果的準確率、敏感度、特異度均在 95% 以上,并能得出與人類相似甚至更高的準確率。其次,計算機對比圖像像素與像素之間的差異,觀察到人類關注不到的細節(jié),從而得出更精準的判斷,且不像人類一樣受主觀性干擾。另外,我們通過「遷移學習」這種算法,還能診斷不同系統(tǒng)的疾病,比如我們的系統(tǒng)目前還能準確鑒別肺炎和正常胸部 X 線平片,區(qū)分肺炎的病原體為細菌還是病毒,準確率可達 90% 以上。
機器之心:從醫(yī)學學者的角度來看,人工智能技術在醫(yī)療領域里是否會像很多媒體報道的那樣「超越,甚至代替人類醫(yī)生」?
張康:在上一個問題已經回答了,在某些方面人工智能的確有可能超越人類醫(yī)生。也許在不久的將來,比較單一的、流水線作業(yè)式的領域將會被取代。但是,現(xiàn)階段人工智能的作用是輔助醫(yī)生而非取代醫(yī)生,發(fā)展人工智能,對醫(yī)療科學的發(fā)展、醫(yī)療水準的提高,都是利大于弊的。
機器之心:深度學習先驅吳恩達(Andrew Ng)認為遷移學習(Transfer learning)是人工智能未來最有希望的發(fā)展方向,而你的研究正是應用了遷移學習。相比其他機器學習方法,它具備哪些優(yōu)秀之處?
張康:「遷移學習」被認為是一種高效的學習技術,尤其是面臨相對有限的訓練數(shù)據(jù)時。相較于其他大多數(shù)學習模型的「從零開始」,「遷移學習」利用卷積神經網絡(Convolutional Neural Network,CNN)學習已有的已經標記好的預訓練網絡系統(tǒng),以醫(yī)學圖像學習為例,該系統(tǒng)會識別預系統(tǒng)中圖像的特點,我們再繼續(xù)導入含有第一層圖像相似參數(shù)和結構的網絡系統(tǒng),最終構建出終極層級。在我們的系統(tǒng)中,第一層網絡就是視網膜 OCT 圖像,第二級網絡系統(tǒng)使用第一級的圖像尋找相應的特點,通過前向傳播固定低層圖像中的權重,找到已經學習的可辨別的結構,再提取更高層的權重,在其中進行反復的自我調整和反饋、傳遞,達到學習區(qū)分特定類型的圖像的目的。我們首次使用如此龐大的標注好的高質量視網膜 OCT 數(shù)據(jù)進行遷移學習,進行常見視網膜致盲性疾病的檢測及推薦治療手段,得到與人類醫(yī)生相似甚至更高的準確性。此人工智能系統(tǒng)還可以「舉一反三」,將遷移學習用于小兒肺炎診斷。
遷移學習是深度學習的一個自然發(fā)展方向,遷移學習能讓深度學習變得更加可靠,還能幫我們理解深度學習的模型。比如,我們能夠知曉哪部分特征容易遷移,這些特征所對應的是某個領域比較高層、抽象的一些結構型概念。把它們的細節(jié)區(qū)分開,就能讓我們對這個領域的知識表達形成一個更深的理解。這樣一來,機器就可以像生物的神經系統(tǒng)一樣終身學習,不斷地對過去的知識進行總結、歸納,讓一個系統(tǒng)越學越快,而且在學習過程中還能發(fā)現(xiàn)如何學習。
遷移學習在深度學習上面有極為廣闊的應用前景,在圖像數(shù)據(jù)資源有限的醫(yī)療領域,更高效、所需圖像數(shù)量更少的遷移學習,可以說是未來 5 年內 AI 發(fā)展的熱點以及深度學習成功應用的驅動力。
卷積神經網絡示意圖,該圖描述了新研究在 ImageNet 數(shù)據(jù)集 1000 個類別上訓練的卷積神經網絡在面對全新 OCT 圖像數(shù)據(jù)集時可以顯著提高準確率、降低訓練時間。區(qū)域鏈接的(卷積)層會被凍結并遷移到新網絡中,而最后,在遷移層之上,全連接層會被重新創(chuàng)建,并被隨機初始化重新訓練。(Credit:論文《Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning》)
機器之心:這項工作中,你們與廣州市婦女兒童醫(yī)療中心、四川大學華西醫(yī)院、同仁眼科中心、上海市第一人民醫(yī)院、大連北海醫(yī)院等機構進行了合作,這些合作是如何開展的?
張康:感謝這些醫(yī)院為我們提供了寶貴的大量原始醫(yī)療圖像數(shù)據(jù),且由不同??频尼t(yī)生對圖像予以分類、標注,幫助訓練 AI 系統(tǒng)獲得更精準更穩(wěn)定的診斷結果。
機器之心:我們都非常期待人工智能可以幫助我們治療疾病,發(fā)表在《Cell》上的研究距離實際應用還有多遠?
張康:我們目前已開始在美國和拉丁美洲診所進行小規(guī)模臨床試用,進一步優(yōu)化系統(tǒng),在未來很快時間里應該可以大規(guī)模使用。我們會同時增加準確標注的圖片數(shù)量和疾病種類,如初步篩查常見疾病、就醫(yī)轉診指引等功能將可能首先應用于臨床,下一步則為指導治療方案確定、隨訪等,最終的目標是應用到包括初級保健、社區(qū)醫(yī)療、家庭醫(yī)生、急診室,形成大范圍的自動化分診系統(tǒng)等。
機器之心:計算機科學領域的研究者們(如斯坦福大學吳恩達 Andrew Ng 團隊、李飛飛團隊)也在致力于將計算機視覺方法應用于醫(yī)療領域。作為另一個行業(yè)的學者,你是如何看待他們的研究的?
張康:他們的成果為我們的研究提供了理論基礎,我們學習了他們的技術,并在他們開發(fā)的「遷移學習」模型為基礎作出改進,組織一個龐大而有序的視網膜專家小組,加入總共約 11 萬張準確標注的視網膜 OCT 圖像以及 5000 張胸部 X 線圖像,構建出我們的 AI 疾病圖像診斷系統(tǒng)。可以說,我們取得今日的突破和他們的貢獻是分不開的,感謝像他們一樣的計算機學者的付出,才讓我們得以更好的結合計算機視覺科學與醫(yī)療科學,從而更好的服務于全人類。
機器之心:這種以醫(yī)生為主導的 AI+醫(yī)療研究與其他以人工智能學者為主導的 AI+醫(yī)療研究有什么不同?
張康:過去的人工智能研究多以人工智能學者為主導,也許能更快的設計出更為精妙的算法,但由于其對臨床醫(yī)生的需求的不了解,使其真正應有于臨床受到限制?,F(xiàn)在,我們的團隊由專業(yè)的醫(yī)生帶領人工智能學者構成,我們更能了解醫(yī)生對形成診斷、確定治療方案的需求,在我們的研究中,我們醫(yī)生知道什么樣的醫(yī)學圖像診斷價值更高,從而親自設定規(guī)范的圖片納入標準,對圖像進行標注,從而使機器從源頭開始就更能獲得我們想要的結果。
比如,有一些圖像特征較為模糊的圖像,如老年黃斑變性,某些較大的玻璃膜疣和脈絡膜新生血管非常相似,我們就會偏向于采取更為嚴重的疾病診斷,因為我們研究的最終目的是幫助病人更可能的推薦給相應的專科醫(yī)生,從而更快的獲得治療。另外,我們還可以通過我們的想法設定更為貼合實際的過濾器,并按照我們臨床醫(yī)生的需求不斷調整;通過「遮擋實驗」能夠反映機器得出判斷的依據(jù)。并且,我們的研究還能指導治療方案的確定。因此我們的研究可能更能達到臨床醫(yī)生想要的效果,并且為臨床醫(yī)生所信任,也許能更快更直接的應用于臨床。
機器之心:如何減少醫(yī)學領域與計算機科學領域之間的隔閡,讓新技術能夠更好地造福人類?
張康:就我們團隊來說,我們以臨床經驗豐富的醫(yī)生、教授為主導,輔以有生物醫(yī)學知識的科學計算經驗豐富的計算機專家,還有高通和 Intel 等計算機軟硬件領域的行家作為我們的技術指導,在算法的完善和使用上起到很大的幫助。同時,我們定期會一起進行溝通交流,讓程序員們更好的了解我們醫(yī)生的需求。只有醫(yī)學領域和計算機領域的人才之間互相幫助、互相指導、通力協(xié)作,才能使新技術真正的獲得應用,更好的造福人類。
機器之心:目前的機器學習方法需要大量醫(yī)療圖像用于模型的訓練,如何避免泄露隱私的問題?
張康:目前的機器學習方法的確需要大量醫(yī)療圖像用于模型的訓練,雖然我們使用的「遷移學習」較傳統(tǒng)的深度學習所需的數(shù)據(jù)量少,增加相應的優(yōu)質數(shù)據(jù)確能更加高效的大幅度提升訓練效果。通過大量的數(shù)據(jù)輸入,AI 系統(tǒng)可以在不斷的學習過程中進行調整,不斷減少誤差,從而獲得更穩(wěn)定更準確的結果輸出。
我們可以保證的是,我們用來訓練機器的醫(yī)療圖像都是僅有疾病表現(xiàn)而不包含病人基本信息的(如姓名、年齡、性別等)圖像,因此不存在隱私泄漏的問題。
機器之心:如何看待中國和美國在人工智能醫(yī)療領域發(fā)展上的差距或者不同?
張康:個人認為,中國在人工智能醫(yī)療領域其整體發(fā)展水平與發(fā)達國家相比仍存在一定差距,在前沿基礎理論的學習、人才培訓交流、關鍵性技術的強化,以及對數(shù)據(jù)收集的優(yōu)化、質量的提升、檔案的系統(tǒng)性、增加數(shù)據(jù)調用的方便性等方面都有待完善。
目前,國內大多數(shù)醫(yī)療人工智能仍處于實驗研發(fā)階段,其整體發(fā)展水平與發(fā)達國家相比仍存在一定差距,在前沿基礎理論、關鍵性技術、產業(yè)基礎平臺、人才隊伍和監(jiān)管體系等方面都有待完善。要相信,現(xiàn)階段人工智能的作用是輔助醫(yī)生而非取代醫(yī)生,從而幫助患者更容易獲得治療,隨著今后醫(yī)療資源的自由流動,醫(yī)院可能更需要輔助診斷系統(tǒng),未來醫(yī)療人工智能是否能獲得更有效的應用、開發(fā)出成熟的產品,還有賴于國家對 AI 產品使用的支持、臨床醫(yī)生的信賴與合作。通過加強國際交流合作、人才培訓、構建研發(fā)中心,發(fā)揮我國疾病庫資源龐大的優(yōu)勢,加強數(shù)據(jù)共享、優(yōu)化數(shù)據(jù),保持人才的長期交流與協(xié)作,才能獲得更好的發(fā)展。
機器之心:在這項成功的研究之后,能否透露一下你下一步的 AI+醫(yī)療研究方向?
張康:通過算法系統(tǒng)的調整,繼續(xù)改進學習、導出結果等過程;我們的 AI 系統(tǒng)對于全身各系統(tǒng)可以進行圖像檢測的疾病都具有適用性,因此我們將進一步增加準確標注的圖片數(shù)量,加入不同的圖像類型,增加可診斷的眼部疾病,另外,加入包括腫瘤,兒童和婦產科,病理等其他系統(tǒng)的疾病圖片,增加其可診斷的疾病種類。同時,在疾病預測、指導治療等等方面增加系統(tǒng)的適用性。
本文為機器之心原創(chuàng),轉載請聯(lián)系本公眾號獲得授權。