前幾年的“人工智能熱”讓大小廠商陸續跳入AI芯片的研發大軍中,而當這股潮水褪去,當初的50多家公司大多數都黯然退出歷史舞臺,如今只剩10家左右。AI芯片的風口已然過去。據艾瑞咨詢發布的2019年《AI芯片行業研究報告》指出,目前AI芯片行業接近Gartner技術曲線泡沫頂端,只有通過市場檢驗和篩選的優質團隊才能夠繼續獲得產業、政策和資本的青睞與支持。
隨著AI芯片進入深水區,人們更關注的不再是單純的算力,還有對應用落地和商業化的支持:進入了哪些場景?合作了哪些客戶?有沒有軟硬一體化方案?是否已經有實際案例?……“AI落地難”已成行業共識,浮華過后,AI芯片接下來將進入市場檢驗真理的階段。
AI芯片為何落地難?
首先,我們來看下當前AI芯片的格局。目前市面上AI芯片主要分為云端AI芯片與終端AI 芯片,云端AI芯片主要部署在大型服務器中,可支持圖像、語音等不同類別的AI 應用;終端芯片則被放在音箱、攝像頭等硬件設備中。由于云端芯片起步較早,且所需要協同的CPU/GPU等硬件成本投入規模高,該領域已被英偉達、Intel等巨頭瓜分殆盡;國內一眾AI從業者大多選擇發力在終端芯片領域,如自動駕駛、安防、零售、智能硬件等。但AI芯片終端市場細分化、碎片化、應用場景不明確也是一大難題。
至于AI芯片落地難的原因可能有無數個。例如,芯片研發比AI語言的更迭速度慢,當芯片面市時,其采用的AI語言可能已經過時了。這種問題首先體現在量產,但歸根結底,缺乏殺手級應用場景才是最致命的。AI芯片廠商高投入研發過后,卻不知道自己的產品要賣給哪些客戶或者說應用到哪些產品上,無法找到可持續性的落地場景。
地平線的聯合創始人兼副總裁黃暢表示,缺乏殺手級應用使得現有的AI芯片大多沒有清晰的定位,無法高度優化PPA。做半導體的都知道PPA有多么重要,尤其是Performance。AI芯片需要針對應用場景進行設計,以此來指導研發調整優化方向,引導客戶進行正確選擇,同時能夠促進行業有序協同向前發展。
再者,用戶接受度也不高,AI應用所需要的數據閉環難以形成。需要明確的是,AI應用開發模式與傳統軟件開發流程不同,傳統軟件開發可清晰定義功能,通過編程就能實現;而AI應用則要通過示例(數據)來定義功能再進行開發,需要形成數據閉環,且自動迭代。
“AI是一個全新領域,AI芯片需要支撐的不僅是AI計算,更要面向場景,實現完整的功能。芯片公司多年的積累不是主要矛盾,其主要矛盾是如何將軟硬件結合起來,開發出一個高效能、低功耗、低成本,同時能夠又快又準的完成自主機器人的任務。AI芯片的成功不止于將ISP調的好,能夠看清楚;也不是將傳統的語音算法做的更精進,更不是說一個傳統的車規芯片公司把CPU和DSP升級成一個NPU,AI芯片沒有那么簡單?!秉S暢如是說。
在紛繁復雜的碎片化終端市場中,最需要什么樣的AI芯片?黃暢認為:“需要的是能極致優化PPA的AI芯片,這個PPA的提升需是數量級的,要能適應未來數年的算法演進,同時充分考慮算法發展,從而能真正替代GPU?!?/p>
但黃暢也告訴半導體行業觀察記者,目前AI芯片也有其可取之處,例如,大多數AI芯片的工具鏈都能對場景深度學習框架有比較好的支持,也培養了一些開發者,在開發成本上有一定的降低,減少了對于Cuda之類的編程生態的依賴。
誰來定義AI芯片的“好壞”?
都說AI芯片難落地,客戶難評判,那么一款AI芯片的“好壞”究竟如何來評估呢?是TFLOPS?是TOPS?還是MLPerf?AI芯片界好像依然沒能找到完美體現真實性能的衡量標準。
為何這么說?目前業界慣常使用的芯片評測標準有兩種,一是峰值算力,但這只反映AI芯片理論上的最大計算能力,而非在實際AI應用場景中的處理能力,具有很大的局限性;二是目前行業較為知名的基準測試組織MLPerf,但其采用的模型少且更新速度滯后于算法演進的速度,無法及時反映算法效率的提升以及各種精度下芯片能夠達到的計算速度,因而無法描述芯片AI性能的全貌。
針對當前AI芯片評測中存在的問題,地平線提出MAPS(Mean Accuracy-guaranteed Processing Speed)評測方法,針對應用場景的特點,在精度有保障的前提下,包容所有與算法相關的選擇,評估芯片對數據的平均處理速度。為行業提供一個評估芯片AI性能的全新視角。
“評估芯片AI性能,本質上應該關注做AI任務的速度和精度,即‘多快’和‘多準’?!?/p>
黃暢介紹說:“MAPS評測方法,能關注真實的用戶價值,將每顆芯片在‘快’和‘準’這兩個關鍵維度上的取舍變化直觀地展現出來,并在合理的精度范圍內,評估芯片的平均處理速度。這個方法具有可視化和可量化的特點?!?/p>
MAPS 聚焦“快”和“準”兩個關鍵評測維度,用最優幀率精度所圍面積直接體現 AI 芯片的最強能力
按照黃暢的說法,這個全新的MAPS評估方式對行業來說有六大創新之處:
第一,它將芯片的Benchmark通過圖形變得可視化,表達更精準;
第二,該方式關注真實、面向結果的需求,只在乎精度和速度,不在乎中間任何關于算法的取舍和選擇;
第三,可以統一表示精度與速度,關注主流精度區間;
第四,隱藏與最終結果無關的中間變量,包括模型、輸入大小、批處理的量是多大;
第五,通過MAPS評估方法可以在算力之外幫助用戶理解這個芯片到底能跑多快以及多好;
第六,留有最大的空間引導客戶使用最優的方式使用某一顆芯片,這一點非常重要,是去真正指導客戶使用這個芯片的最佳實踐。
芯片是個生態系統,單獨依靠一家之力是玩不轉的。地平線的MAPS評估標準最重要的意義是讓行業能夠形成一種合力,讓大家更好的協同,不管你是買方還是賣方,大家都有一個相對清晰的目標,容易形成共識、形成協力,這樣才好健康地去推動整個行業往前發展。黃暢表示。
AI芯片花開兩朵:“旭日”東升,“征程”萬里
有了好的評估標準之后,AI產業向好,經歷過大風大浪的AI芯片,最終將落在哪些場景中呢?作為一家以“為客戶提供的智能化價值”的人工智能公司,地平線將其AI芯片的種子灑向了AIoT和自動駕駛航道,花開兩朵,同心向陽。
“做AI芯片需要企業有很強的洞察力,要在三五年前找到落腳點,以創造真實的價值為導向,本著長期主義的精神堅持不懈的走下去。”黃暢談到。
自動駕駛被看作是AI芯片的殺手級應用的潛力市場,近年來伴隨智能駕駛滲透率的提升,全球芯片巨頭也在紛紛向汽車這個產業靠攏。汽車AI芯片市場未來仍是各大巨頭競爭角逐之地。目前在AI自動駕駛方面,國外的英偉達、英特爾、特斯拉,國內的華為、地平線、寒武紀以及芯馳科技等一眾廠商都在深耕這個領域。
地平線是中國最早進入AI芯片領域的人工智能企業。2015年,在國內AI芯片仍未進入大眾視野時,地平線公司成立,率先提出軟硬結合的BPU芯片架構;2017年,發布中國第一款邊緣AI芯片:旭日一代和征程一代;2018年,征程芯片助力國際頂尖Robotaxi車隊;2019年,宣布正式量產中國首款車規級AI芯片征程2。
這幾年,地平線在商業化的道路上越走越穩。就拿征程2 來說,該產品可全方位實現車內場景化感知,并基于感知結果為用戶提供更精準的智能推薦以及智能車控等服務。
今年3月份,地平線征程2登陸長安UNI-T前裝量產,使長安UNI-T成為首款搭載國產人工智能芯片的智能汽車,而且也讓它走在了世界前列,成為全球首款智能人機交互SUV。
眾所周知,車載AI芯片是人工智能行業的珠穆朗瑪,也是自動駕駛實現大規模落地的前提。車規級芯片產品的開發周期長、難度大,是硬科技、長跑道的創新。在汽車芯片如此高標準以及長供貨周期、與主機廠長久的合作關系下,汽車芯片一旦能夠量產,其供應格局相對來說就較為穩定。
雖然,相比市場前景更大、場景更為復雜的自動駕駛,地平線在AIoT領域的聲量較小,但其重視程度絲毫不差。據了解,其旭日系列芯片所服務的客戶已過百家。去年發布的旭日2的表現也相當亮眼,在旭日2上的實際測試結果表明,分類模型 MobileNet V2 的運行速度超每秒 700 張圖片,實際性能能夠達到甚至超過業內標稱 4TOPS 算力的 AI 芯片。
在AIoT領域,地平線堅持底層技術能力研發與解決方案的打造,加速普惠 AI 時代到來;在開發者生態方面,地平線則通過工具鏈服務降低開發者門檻,助力上層應用產生,以此豐富整個 AIoT 應用生態,用行業的力量推動行業。目前,地平線已攜手上百家 AIoT合作伙伴為產業提供賦能服務,實現線下場景服務數千萬人口。
結語
自去年旭日2的發布,又經過近一年的商業化落地和技術錘煉,面向AIoT市場的旭日3正呼之欲出。在此,想劇透下,此前,地平線有在ImagetNet模型上進行了一項MAPS測試,下圖中有一顆地平線即將推出的芯片,在與表現最優的標稱11.4TOPS峰值算力的AI芯片對比中,新的芯片雖然在高精度上稍有劣勢,但在追求速度和低延遲等場景中會有不俗的表現。9月9日上午,“地平線”盡頭將再次升起一輪“旭日”!
ImageNet圖像分類 75~80.5%精度范圍內, MAPS 評估方式下的主流芯片測試結果(右一折線為地平線最新一代芯片測試結果)