9 月 25 日消息,2024 百度云智大會今日在北京召開,百度在大會上宣布全面升級百舸 AI 異構計算平臺 4.0、千帆大模型平臺 3.0 兩大 AI 基礎設施,并升級代碼助手、智能客服、數字人三大 AI 原生應用產品。
百度智能云事業群總裁沈抖表示:“2024 年大模型的產業落地正在加速,目前在千帆大模型平臺上,文心大模型日均調用量超過 7 億次,累計幫助用戶精調了 3 萬個大模型,開發出 70 多萬個企業級應用。過去一年,文心旗艦大模型降價幅度超過 90%,主力模型全面免費。”
升級百舸 4.0
為滿足企業落地大模型從集群創建、開發實驗,到模型訓練、推理的全旅程算力需求,百度智能云升級發布百舸 AI 異構計算平臺 4.0,面向萬卡、十萬卡集群全面升級算力管理能力。
集群創建階段:百舸 4.0 預置了主流的大模型訓練工具,能夠實現工具層面的秒級部署,并將萬卡集群運行準備時間從幾周縮減至 1 小時。
開發實驗階段:企業需要針對業務目標對不同架構、參數的模型進行多次測試,進而制定最佳模型訓練策略,保障后續訓練的性能和效果。百舸 4.0 全新升級的可觀測大盤,能夠對多芯適配、集群效能、任務自動容錯等方面進行全方位監測。
模型訓練階段:百舸 4.0 能夠自動篩查集群狀態,并基于對 GPU 故障的預測,及時轉移工作負載,降低故障發生頻次。此外,百舸故障秒級感知定位、Flash Checkpoint 模型任務狀態回滾等技術,能夠減少集群故障處置時間。
百度官方表示,目前百舸在萬卡集群上實現了有效訓練時長占比 99.5% 以上。此外,百舸 4.0 通過集群設計、任務調度、并行策略、顯存優化等一系列升級,整體性能相比業界平均水平提升 30%。
在模型推理環節,百舸則通過架構分離、KV Cache、負載分配等一系列加速方法,實現了模型推理的降本提效,尤其在長文本推理方面,推理效率號稱提升超過 1 倍。
百舸 4.0 號稱已經構建了十萬卡級別的超大規模無擁塞 HPN 高性能網絡、10ms 級別超高精度網絡監控,以及面向十萬卡集群的分鐘級故障恢復能力。
千帆 3.0,三大服務升級
為了滿足企業客戶對模型調用、模型開發、應用開發的需求,百度智能云發布千帆大模型平臺 3.0。
模型調用方面:升級后的千帆平臺,不但可以調用包括文心系列大模型在內的近百個國內外大模型,還支持調用語音、視覺等各種傳統的小模型。過去一年,文心旗艦大模型降價幅度超過 90%、主力模型全面免費。
模型開發方面:對于需要定制、微調專屬模型的客戶,千帆 3.0 不僅提供了大模型工具鏈,還支持 CV、NLP、語音等傳統模型的開發,并實現數據、模型、算力等資源的統一納管和調度。
模型投入使用后,千帆平臺還支持企業將應用中產生的數據,經過采樣評估、人工標注、對齊或微調等方式反饋給模型,形成數據飛輪。
應用開發方面:針對企業落地大模型的高頻應用場景,千帆 3.0 從檢索效果、檢索性能、存儲擴展、調配靈活性四方面對企業級檢索增強生成(RAG)進行了升級;針對企業級 Agent 的開發,千帆 3.0 增加了業務自主編排、人工編排、知識注入、記憶能力以及百度搜索等 80 多個官方組件支持。
此外,本次大會還發布了智能化低代碼應用開發平臺“AI 速搭”,通過自然語言對話就能進行企業級應用開發。
代碼助手、智能客服、數字人升級
為了滿足企業直接選購成熟 AI 應用的需求,百度智能云面向數字人、智能客服、代碼提效,升級了三大 AI 原生應用產品,IT之家匯總升級內容如下:
1、基于文心大模型重構的 AI 原生智能客服應用“客悅”:
在用戶復雜意圖理解、多模態信息交流等方面實現了大幅提升,讓智能客服變得更聰明、更擬人。
“問題自助解決率”是智能客服領域最關鍵的考核指標,當前業內平均水平是 80%,升級后,客悅將這一指標提升至 92%。
目前,客悅已累計幫助企業客戶服務超過 1.5 億人次,交互超過 5 億次。
2、基于大模型能力,新升級的曦靈數字人 4.0:
支持根據文字快速生成不同妝造、不同行業特色的 3D 數字人形象和視頻。本次大會期間,曦靈平臺宣布:將 3D 超寫實數字人的價格從萬元降價至 199 元。
全新升級的 4D(3D + 時間維度)自動綁定技術和創新模態遷移技術,還解決了傳統 2D 數字人動作僵硬的問題,可以實現人物在不同角度、形體、表情的高度一致,即使是面部微表情也能做到自然、逼真。
3、全新升級的全流程 AI 代碼提效工具“文心快碼”:
本次大會,文心快碼業界首發「企業級代碼架構解釋」、「企業級代碼審查」兩項全新功能。企業級代碼架構解釋能在項目接手初期,實現工程架構的智能解讀,幫工程師快速理解業務邏輯;而企業級代碼審查則能傳承資深工程師的編碼經驗,智能輔助程序員查缺補漏。
此外,針對市面上通用代碼助手缺乏對企業歷史代碼庫的理解的痛點,文心快碼全新升級的「企業級代碼輔助能力」能夠深度理解企業代碼庫,快速學習企業過往的代碼與規范,讓生成的代碼更貼近企業的要求。
目前,文心快碼已經服務超過 1 萬家企業客戶,整體研發效率提升 20%。