《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 從任務角度分析深度學習硬件發展趨勢

從任務角度分析深度學習硬件發展趨勢

2017-01-04

從微小器件到海量數據中心,格外強勁的硬件將能為深度學習領域內的一切提供助力。

2016 年 3 月份,谷歌 DeepMind 的計算機在多輪圍棋比賽中擊敗了世界圍棋冠軍李世乭。這一事件標志著人工智能領域內的一個新里程碑。獲勝的 AlphaGo 借力于現在為大家所熟知的深度學習——一種人工神經網絡;在這種神經網絡里有很多計算處理層,可以用來自動尋找問題的解決方案。

那時候人們還不知道谷歌正在悄然開發為這一勝利提供助力的秘密武器——一種專用硬件,在谷歌用于擊敗世界冠軍李世石的計算機里已有這種特殊硬件。這種硬件被谷歌稱為張量處理單元(TPU/Tensor Processing Unit)。

谷歌的一位硬件工程師 Norm Jouppi 在這場圍棋大戰的兩個月后宣布了張量處理單元的存在,并解釋說谷歌的數據中心已經使用這些新型加速器一年多了。谷歌還沒有公布這些集成板上到底有什么奧妙,但毫無疑問的是,這代表著加速深度學習計算上的一個日益流行的策略:使用專用集成電路(ASIC)。

1483083903530075678.jpg


來自深度學習軟件的收入很快就將超過十億美元(單位:十億美元)

企業(主要是微軟)追求的另一個戰術是使用現場可編程門陣列(FPGA),其有可重配置的優勢,可以根據計算需求進行修改。而更常見的方法則是使用圖形處理單元(GPU),這種計算設備可以并行地同時執行大量數學運算。最知名的 GPU 提供商英偉達(NVIDIA)近段時間以來的股價飛漲也正是得益于此。

事實上,GPU 在 2009 年的時候就已經在驅動人工神經網絡了,那時候斯坦大學的一些研究者證明這種硬件使得深度神經網絡的訓練時間很適宜。

「今天所有人都在做深度學習,」斯坦福大學 Concurrent VLSI Architecture 研究組的領導者兼英偉達首席科學家 William Dally 說。他說這從他的角度來看是不足為奇的。「GPU 幾乎和你想象的一樣美好。」

Dally 解釋說有三個獨立的領域需要考慮。第一是他所說的「數據中心中的訓練」。他認為任何深度學習系統的第一步都是:調節神經元之間大約數百萬個連接以使網絡能夠完成分配給它的任務。

已被英特爾收購的公司 Nervana Systems 在這種任務的硬件開發上取得了領先。Nervana 計算機科學家 Scott Leishman 表示 Nervana Engine 是一款 ASIC 的深度學習加速器,其將在 2017 年初期到中期的時候投入生產。Leishman 指出另一個計算密集型任務——比特幣挖礦(bitcoin mining),就曾經從 CPU 實現轉向 GPU,然后轉向 FPGA 并最終轉向了 ASIC,因為定制的硬件能夠實現更優的能量效率。他說:「我認為同樣的情況正在深度學習領域發生。」

Dally 說,深度學習硬件的第二個任務(大為異于第一個任務)是「數據中心中的推理」。「推理(inference)」這個詞在這里的意思是:用于之前任務的已訓練的基于云的人工神經網絡在同樣的任務上能進行持續運算。谷歌的神經網絡每天都要執行天文數字級別的推理計算,以幫助用戶分類圖片、翻譯語言和識別口語等等。盡管外界還不能百分之百確定,但可以推理谷歌的張量處理單元應該在為這些計算提供助力。


1483083903561058531.jpg

加滿油門:谷歌的 TPU 正在該公司的服務器里加速深度學習計算

訓練和推理常常需要運用不同的技能設置。通常對訓練的設置上,機器必須能夠實施精確度相對較高的計算,常使用 32 位的浮點計算。對于推理,則可以犧牲精確度以獲取更快的速度和更低的功耗。「這是研究領域里一個很活躍的區域,」Leishman 說道。「你能達到的最低限度是多少?」

雖然 Dally 謝絕泄露英偉達的特別計劃,但他指出英偉達的 GPU 正在完成升級。英偉達的早期版本——Maxwell 的架構能夠進行雙精度(64 位)和單精度(32 位)的計算,而目前的 Pascal 架構則增加了處理 16 位運算的能力,支持雙倍輸入且效率也是之前單精度計算的兩倍。所以不難想象英偉達最終將會推出能進行 8 位運算的 GPU,這樣的 GPU 將是在云端進行推理運算的理想硬件,因為對云端推理來說能源效率是控制成本的關鍵因素。

Dally 補充說:「三個支撐深度學習關鍵任務的最后一個任務就是在嵌入式設備里進行推理,」比如智能手機、相機和平板電腦。對于這些應用,關鍵是實現低能耗的專用集成電路(ASIC)。在即將來到的一年,深度學習軟件將會越來越多的實現手機端應用,比如目前已有的手機端應用——惡意軟件檢測以及圖片中的文字翻譯。

除此之外,無人機生產商大疆(DJI)已經開始在其幽靈 4(Phantom 4)無人機中使用與專用集成電路的深度學習相類似的器件,大疆所使用的器件是一個由加州廠商 Movidius 制造的特殊視覺處理芯片,這個芯片用來識別障礙物。(Movidius 同時也是英特爾最近收購的另一家神經網絡相關的公司)。與此同時高通(Qualcomm)在其 Snapdragon 820 處理器里放置了一個特殊的電路系統來更好地執行深度學習運算。

雖然目前有很多因素促使硬件設計來加速深度神經網絡的計算,但巨大的風險依然并存:如果神經網絡的進步太快,所設計來運行過往的神經網絡的芯片在出廠時就會過時。「算法正以非常快的速度改變,」Dally 說。「所有從事構建這些硬件的人都在試圖贏得這場賭注。」


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 久久免费高清 | 九九国产| 久久天天躁综合夜夜黑人鲁色 | 九九久久精品这里久久网 | 国产欧美日韩在线观看精品 | 日本亚州在线播放精品 | 久久99精品久久久久久久不卡 | 久久久久国产精品免费看 | 香蕉超级碰碰碰97视频在线观看 | 99视频网站 | 欧美成国产精品 | 沈樵在线观看福利 | 亚洲超大尺度激情啪啪人体 | 精品视频一区二区三区在线观看 | 中文字幕在线观看一区二区三区 | 毛片毛片毛是个毛毛片 | 成人亚洲欧美综合 | 毛片免费观看网址 | 美女在线网站免费的 | 男女扒开双腿猛进入免费网站 | 精品国产a | 在线播放精品一区二区啪视频 | 亚洲一级片在线播放 | 国产成人女人在线视频观看 | 人与拘一级a毛片 | 亚洲国产成人最新精品资源 | 国产精品久久久久久亚洲伦理 | 欧美大片欧美毛片大片 | 在线观看日本视频免费 | 91最新地址永久入口 | 黄色三级网 | 麻豆视频国产 | 欧美一级在线视频 | 国产一区二区三区四区波多野结衣 | 久久国产中文字幕 | 日本一级特黄在线播放 | 特黄特色三级在线播放 | 国产aⅴ精品一区二区三区久久 | 精品视频在线免费播放 | 成年人在线视频网站 | 99久免费精品视频在线观看2 |