7 月 19 日消息,商湯科技聯合創始人、首席科學家王曉剛 17 日宣布,商湯絕影在行業內率先實現了原生多模態大模型的車端部署。車載端側 8B 模型首包延遲在 300 毫秒以內,推理速度 40 Tokens / 秒,覆蓋主流算力平臺。
商湯絕影為多模態大模型打造計算引擎“HyperPPL”,目前擴展并支持主流車載計算硬件,兼容多種主流操作系統,適配多個車載芯片的部署平臺。
商湯絕影稱 HyperPPL 針對車載多人場景進行優化,使得車內多人并發情況下,車端多模態大模型的模型推理效率相比單人沒有明顯降低。
據IT之家此前報道,商湯絕影此前表示,深圳首條自動駕駛公交線路采用其車輛與技術,所有駕駛操作都無需人員介入。
明年上千 TOPS 算力的車載芯片(英偉達 Thor)就會問世。基于更高算力的計算平臺,商湯預計絕影多模態大模型車端部署方案的首包延遲將大幅降低,推理速度進一步提高。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]。