近日,主題為“構(gòu)想煥發(fā)生機的未來社會”的日本大阪·關(guān)西世博會(以下簡稱“大阪世博會”)如期舉辦,科大訊飛攜人工智能大模型展項“AI孫悟空”亮相世博會中國館,并同期發(fā)布訊飛雙屏翻譯機2.0。作為世博會中國館唯一大模型展項,科大訊飛向世界展示了中國人工智能企業(yè)領(lǐng)先的AI大模型技術(shù)積累。
自大模型立項之初,科大訊飛就堅持推進(jìn)算法、算力、數(shù)據(jù)全鏈條的自主可控性建設(shè),目前旗下自主研發(fā)的星火大模型已在復(fù)雜推理、多模態(tài)交互等關(guān)鍵領(lǐng)域達(dá)到國際先進(jìn)水平。依托于大模型技術(shù)的升級,此次大阪世博會才有了遠(yuǎn)道而來的“AI孫悟空”與跨越語言壁壘的訊飛雙屏翻譯機2.0。
當(dāng)來自全球的參觀者與“AI孫悟空”展開妙趣橫生的多模態(tài)互動,當(dāng)不同語言的參會者通過訊飛雙屏翻譯機2.0實現(xiàn)零障礙溝通,那些看似尋常的對話瞬間,都涌動著來自科大訊飛的創(chuàng)新力量,那些跨越國界的交流背后,都蘊含著中國與世界的智慧碰撞。
1、大模型全棧自主可控
“悟空,你好!”言語間只見身穿西瓜裙、手拿金箍棒的“AI孫悟空”騰云駕霧現(xiàn)身于水墨云海中,以動畫《大鬧天宮》高還原聲線說道:“俺老孫來也!”
這位“數(shù)字大圣”以全國產(chǎn)自主可控的訊飛星火大模型為基礎(chǔ),融合了多語種、高噪場景語音識別、多情感超擬人語音合成以及多模態(tài)交互等技術(shù)能力,跨越覆蓋文字、圖像、語音各模態(tài),在聚集眾多觀眾的世博會現(xiàn)場,“AI孫悟空”也能聽清、聽懂觀眾說出的問題,生動還原孫悟空惟妙惟肖的動畫角色形象和聲線,以中、日、英三種語言與觀眾展開自由深度的交流。
“AI孫悟空”的惟妙惟肖,正是科大訊飛堅持全棧自主可控的集中體現(xiàn),這種技術(shù)自主性不僅確保了核心能力不受制于人,更讓科大訊飛向世界展現(xiàn)了中華文化精髓與前沿技術(shù)的靈活創(chuàng)新——當(dāng)觀眾驚嘆于“數(shù)字大圣”流暢的多模態(tài)交互時,實質(zhì)見證的是中國企業(yè)在人工智能領(lǐng)域構(gòu)筑的完整技術(shù)生態(tài)。
年初,科大訊飛董事長劉慶峰一篇《踏平坎坷成大道》的主題演講,為科大訊飛定了調(diào)——堅持“雙輪”驅(qū)動:堅定不移地做自主可控的通用大模型底座;以GBC聯(lián)動的方式,推動大模型應(yīng)用落地及搭載大模型的C端產(chǎn)品普及。
在“堅定不移地做自主可控的通用大模型底座”的指引下,2025年1月,科大訊飛再次升級了訊飛星火4.0 Turbo的底座能力,首發(fā)了端到端的語音同傳大模型、極速超擬人數(shù)字人交互、多模態(tài)影像大模型,并發(fā)布了國內(nèi)首個基于全國產(chǎn)算力平臺訓(xùn)練的星火深度推理模型X1,且于3月再次升級。
依托于多項技術(shù)的升級,科大訊飛的星火大模型具備文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)等七大核心能力,并持續(xù)迭代升級,“AI孫悟空”也由此橫空出世,并在大阪世博會引發(fā)關(guān)注。
2、大模型落地千行百業(yè)
堅持走大模型全棧自主可控路線之外,科大訊飛的另一個輪子則是致力于推動大模型應(yīng)用落地。
做大模型的第一天,科大訊飛就確定了“1+N”的戰(zhàn)略路徑。“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺,“N”是應(yīng)用于教育、醫(yī)療、人機交互、辦公等多個領(lǐng)域的專用大模型。
2024年,科大訊飛結(jié)合通用底座、工具鏈和知識工程,使訊飛星火擁有從頂層規(guī)劃到執(zhí)行落地的全套解決方案,包含“建算力、理數(shù)據(jù)、訓(xùn)模型、落場景、保安全、精運營”。加上訊飛星火行業(yè)能力的持續(xù)提升,使科大訊飛在2024年找到了大模型紅利兌現(xiàn)的“關(guān)鍵鑰匙”。
首先是大模型招投標(biāo)市場,科大訊飛交出了“央國企中標(biāo)數(shù)量和中標(biāo)金額雙第一”的成績單,與此同時,科大訊飛的人工智能技術(shù)在千行百業(yè)落地生根,獲得教育、醫(yī)療、金融等多個領(lǐng)域的應(yīng)用第一。
教育領(lǐng)域,科大訊飛為全國32個省級行政區(qū)、5萬余所學(xué)校、1.3億師生提供智慧教育產(chǎn)品和解決方案。醫(yī)療領(lǐng)域,科大訊飛為醫(yī)生和居民分別打造AI診療助理、AI健康助手,智醫(yī)助理產(chǎn)品在全國31個省市超680個區(qū)縣實現(xiàn)常態(tài)化應(yīng)用。工業(yè)領(lǐng)域,科大訊飛為全國10個省20多個地市提供基于工業(yè)感知、工業(yè)認(rèn)知、工業(yè)大模型、能源大模型等工業(yè)AI技術(shù)的產(chǎn)品和解決方案......
此外,科大訊飛還在智慧教育、智能汽車、消費者服務(wù)等多個領(lǐng)域布局海外業(yè)務(wù),覆蓋歐洲、亞洲、北美、中東、港澳臺等地區(qū),以AI技術(shù)推動中國方案在全球化的實踐。
不僅如此,科大訊飛還致力于推動搭載大模型的C端產(chǎn)品普及,讓智慧生產(chǎn)力工具加速走進(jìn)千家萬戶。其中,訊飛雙屏翻譯機2.0就是一個代表性產(chǎn)品。
作為翻譯工具的性能標(biāo)桿,訊飛雙屏翻譯機2.0不僅延續(xù)并擴大了一代以翻譯為核心,將實時語音翻譯及語音轉(zhuǎn)寫能力廣泛應(yīng)用于多種場景的優(yōu)勢,還通過5G網(wǎng)絡(luò)、國產(chǎn)大模型、強降噪、行業(yè)術(shù)語庫等先進(jìn)技術(shù),增強了翻譯機抗干擾、譯準(zhǔn)確、無卡頓等能力,使跨國商務(wù)洽談、國際學(xué)術(shù)交流等多種場景的溝通更加高效流暢,為世界智能交互按下加速鍵。
不管是在大阪世博會的精彩亮相,還是星火大模型在千行百業(yè)的深耕落地,科大訊飛正以“雙輪驅(qū)動”戰(zhàn)略書寫著中國人工智能發(fā)展的新范式:一方面,通過持續(xù)創(chuàng)新構(gòu)建起完全自主可控的大模型技術(shù)體系;另一方面,將技術(shù)突破轉(zhuǎn)化為推動社會進(jìn)步的動能,讓AI從實驗室走進(jìn)醫(yī)院、教室、工廠等細(xì)分場景。這場始于算法突破、成于場景落地的變革浪潮,正讓科大訊飛以自主創(chuàng)新的技術(shù)語言,向世界講述智能時代的東方智慧。