最近,ChatGPT的大火吸引了科技圈的高度關注,而圍繞這種生成式AI技術的創業潮也隨即被引爆。
無論是對標大模型,打造中國的OpenAI,還是基于大模型開發細分領域的AI工具,或者從底層硬件發力,芯片、互聯網、AI領域的技術大咖紛紛躬身入場,搶占創業先機,唯恐落后他人半步。
業內人士看來,生成式AI技術所創造出的驚人生產力或將改變千行百業,不亞于又一次產業革命,由此引發的創業機會遍及產業上下游,但大模型研發的高技術門檻與高投入,也讓進入這一領域的創業者面臨重重挑戰,在賽道火爆的同時,或更要多點冷思考。
生成式AI創業大佬紛紛入局
伴隨著ChatGPT、谷歌Bard、百度文心一言等的先后發布,生成式AI技術的比拼不僅在行業巨頭中展開,同樣也激發著初創公司的踴躍入場。
一周前,英特爾首席架構師Raja Koduri 突然宣布將于3月底離職。在蘋果和英特爾服務多年后,他將成立一家 AI生成式游戲軟件公司。Raja Koduri表示,將在未來幾周內公布更多關于這家初創公司的信息。顯見其正在緊鑼密鼓的籌劃中。
3月19日,創新工場董事長兼CEO李開復宣布,正在籌建Project AI 2.0公司,定位是AI 2.0全新平臺和AI-first生產力應用的世界級公司。值得關注的是,今年已61歲且經歷多年抗癌成功的李開復,在其博士研究項目即瞄準AI技術40年后,終于又在AI 領域“繼續擼起了袖子”。“Project AI 2.0不僅僅要做中文版 ChatGPT。”李開復表示:“AI 2.0已經到來,這是絕對不能錯過的一次革命,這個時代將誕生新平臺并重寫所有應用。”
而一個月前,美團聯合創始人王慧文同樣發下宏愿,要打造中國的Open AI。為此,王慧文個人出資5千萬美元,已啟動成立光年之外科技有限公司。其老朋友、美團創始人王興在朋友圈表示,“AI大模型讓我既興奮于即將創造出來的巨大生產力,又憂慮它未來對整個世界的沖擊。”此次王慧文的入局,無疑鼓勵了王興,王興表示已決定個人參與光年之外的A輪融資,并將出任董事。
此外,搜狗前CEO王小川、原京東集團高級副總裁周伯文、出門問問創始人兼CEO李志飛、阿里前技術副總裁賈揚清、前字節跳動視覺技術負責人王長虎等也都在最近宣布,將進軍中國版ChatGPT和生成式AI戰場。
而在國外,AI技術人員創業的行動似乎更早一步。根據Business Insider的一項調查統計,2022年內,僅Alphabet一家公司就有26位AI專家離職,其中包括子公司谷歌、DeepMind 兩大科技巨頭,多位AI專家離職后創辦了自己的新公司。
據風投公司NFX統計,目前已有約450家生成式AI公司,它們一共籌集了將近120億美元的資金。資本助力下,科技大佬兒們的搶跑入局,讓這一領域更加火熱。
算力底座面臨變革
AI技術喊了很多年,但在ChatGPT之前,鮮有讓業界整體為之激動的應用落地。ChatGPT智能機器人對話模型的出現,讓AI第一次真正實現像人一樣的說話與“思考”。生成式AI的落地與廣泛應用,正推動AI發展進入新時代。
在剛剛召開的英偉達GTC大會上,英偉達CEO黃仁勛稱ChatGPT代表著“嶄新的計算平臺已經誕生,AI的‘iPhone時刻’已經到來”。在他看來,生成式AI是一種新型計算機、一種可以用人類語言進行編程的計算機,這種能力影響深遠。“現在,每個人都可以命令計算機來解決問題,每個人都可以成為程序員。生成式AI將重塑幾乎所有行業”。
如何利用生成式AI技術重塑千行百業?顯然,這不僅僅是數家、數十家公司的事兒,而是需要整個行業共同的投入與努力。
在深存科技創始人袁靜豐看來,ChatGPT所帶來的機會遍及產業上下游,尤其是對更加“硬核”的上游產業算力基礎設施帶來巨大挑戰,算力芯片、存儲、網絡等底層硬件、數據中心架構面臨變革,也催生了很多新的投資創業機會。
據悉,大模型的訓練具有數據量大、算力需求高、算法復雜、訓練周期長等特點,對底層硬件資源的消耗非常龐大,是典型的數據繁重應用場景。以ChatGPT的開發為例,它相當于是收集了過去20年互聯網的公開數據,要滿足GPT-4的訓練需求,至少需要1萬張英偉達A100顯卡,再加上其他資源,估計達到其需求的數據中心規模至少要投入40-50億元。“這還僅僅只是入場券,而目前要真正做到大模型持續訓練和支持海量訪問服務,在傳統方法下可能需要超10萬張A100顯卡。”袁靜豐指出。
與此同時,大模型的參數數量及規模在快速增長,用戶數量及訪問量也在不斷增加,按照目前趨勢,模型參數規模大概每年增長近10倍,日活訪問量則可能增長更快,這些都對硬件資源帶來驚人的消耗。
“降本增效的需求問題對于GPT這樣的大模型的研發愈發突顯。”袁靜豐指出,“解決由此帶來的挑戰給基礎設施硬件廠商帶來多種機會,主要圍繞數據、算力及算法優化三個方面。”
具體來看,為了解決數據量呈指數級增長且海量并發訪問所帶來的“大而快數據”需求,思考“數據引力”問題變得尤為重要,算力需要離數據越來越近,減少和優化數據搬運是效率提升的關鍵,以數據為核心的計算已成為繼基于GPU的計算加速,DPU/IPU的網絡加速之后的又一重要趨勢。
以深存科技為例,2020年成立之際,在看到快速增長的大模型等數據繁重場景爆發對硬件基礎設施的挑戰趨勢下,將公司定位為“以數據為核心計算”的芯片和解決方案供應商,聚焦高算力、高性能數據加速和I/O加速為核心目標,提供數據繁重場景下的優解方案,研發與存儲系統緊密結合的計算存儲處理器/數據處理芯片,致力解決“大數據”和“快數據”并存的難題。
同樣看好AI技術,并在AI領域投資布局的中科創星創始合伙人米磊則認為:“國內要在軟硬件上同時下功夫,一方面把算法做得更好一點,另一方面提升數據量,解決算力問題,因為現在還面臨高端GPU算力卡脖子問題。”
ChatGPT創業熱潮下的冷思考
從下游的應用方向來看,ChatGPT引發的創業機會主要有兩方面,一是對標ChatGPT,發展自己的通用大模型或細分領域大模型;二是基于這些大模型,針對細分市場開發具體應用工具。
在袁靜豐看來,盡管發展大模型十分燒錢,但在這一行業在全球走向成熟之前,不管是發展通用大模型,還是打造細分領域的特定大模型,都非常有必要。
“因為很多行業或企業的數據是非公開的,像ChatGPT、百度文心一言等大模型無法獲得這些數據來訓練AI,所以這些細分領域也需求建立自己的大模型。”袁靜豐指出,“它可以不像ChatGPT那么復雜,也不需要巨大的數據中心驅動,或者可以直接部署在私有云上,這樣涉及到行業Knowhow、專業領域知識產權等敏感數據就可以不用離開現場,而企業同樣可以享有大模型帶來的AI便利與效率。”
此前,國內在大模型及生成式AI方面的初創公司并不是很多,主要是一些技術實力雄厚的大企業在做,例如,百度、華為、阿里、字節跳動等都在大模型方面有持續投入。總體來看,國內在大模型方面與國外還有一定差距,尤其是最近,GPT-4新一代超大規模多模態大模型的發布,讓生成式AI的能力更進一步提升,給國內的從業者帶來更急迫的壓力和挑戰。
面對大模型在研發方面的挑戰,米磊認為:“我們要優化算法,解鎖上下文學習的能力,首先是通過更多高質量數據和任務進行模型的訓練,達到高質量的境界;其次要通過和環境的交互、自我的優化實現提升;最后要提升自我反思的學習能力。”據悉,在大模型及AI領域,中科創星已投資了智譜AI、瑞萊智慧等初創企業。其中,智譜AI是由清華大學計算機系技術成果轉化而來,其基于千億基座模型的ChatGLM,最近已開啟內測。
而在大模型基礎之上的應用層技術開發門檻相對較低,范圍更廣,或會催生出一批新興創業企業。例如,通過結合ChatGPT等的生成算法和自身的寫作經驗,開發一款智能寫作工具,像AI文本生成公司Regie.ai就是這一類型;還可以基于ChatGPT等的翻譯能力,開發智能翻譯工具等。
但在金沙江創投主管合伙人朱嘯虎看來,這一方向的創業或將較難融資。“ChatGPT太過強大,不利于創業公司,創業公司基于ChatGPT能夠創造的價值非常單薄”,在2023黑馬產業大會上,朱嘯虎公開指出,“未來兩三年內請大家放棄融資的幻想,必須能夠自己造血。”
寫在最后
所謂風險與收益并存,越是挑戰重重的地方,越是蘊含著無限的機會。ChatGPT喚醒了世界對AI技術的重新認知,生成式AI時代的大幕已然拉開。在中國有必要擁有自己的Open AI的產業共識下,對ChatGPT賽道的追捧以及由此帶來的火熱可以預見。但越是火熱,越要冷靜看待,客觀研判。不管是上游底層硬件芯片方面的創新,還是圍繞大模型的研發,以及基于大模型的應用開發,只有結合實際、遵循規律,且耐得住持久的投入和堅持,或才能迎來最終的突破。
來源:集微網
文:王麗英
更多精彩內容歡迎點擊==>>電子技術應用-AET<<