《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 英偉達牽頭發布代碼大模型StarCoder2

英偉達牽頭發布代碼大模型StarCoder2

2024-03-06
來源:36Kr

生成式人工智能的走紅已經持續了一年多時間,而且大概率會一直熱下去。

不過隨著大眾對于AI的了解越來越深入,有一個事實也被不少人用段子的形式揭露了出來,“我以為AI是要來幫人類做家務的,讓我好去寫詩做畫,結果現在AI來了,AI直接開始寫詩做畫了,我依然在掃地做菜”。

如此調侃背后指向了當下的AI過于“風花雪月”,離真正能改變生產力場景太遠。

1.png

01

當然,目前并不是所有的AI大模型廠商都在文生圖、文生視頻賽道狂奔。

日前有消息顯示,英偉達聯合知名AI開源社區Hugging Face和ServiceNow,發布了名為StarCoder2的LLMs系列模型,并希望成為代碼生成領域的新標準。

據悉,LLMs系列系列模型包括一個由ServiceNow訓練的30億參數模型、一個由Hugging Face訓練的70億參數模型,以及一個由英偉達訓練的150億參數模型。

據悉,StarCoder2經過了619門編程語言的訓練,可執行源代碼生成、工作流生成、文本摘要等專業任務。英偉達對此表示,開發人員可以利用它進行代碼補全、高級代碼總結、代碼片段檢索等,從而提高工作效率。

并且值得一提的是,該模型將在BigCode Open RAIL-M許可證的基礎上以開放訪問的方式發布,以允許免版稅分發。與現階段沒有用例限制的傳統開源軟件不同,BigCode在發布模型時附帶了一個負責任的人工智能模型許可證,限制其被用于生成或分發惡意代碼以損害電子系統。

2.png

02

在GitHub Copilot之后,終于又出現了一個真正意義上的代碼生成大模型。那么,這一次人人都能是程序員的時代要來了嗎?當然不是,且不提StarCoder2并有沒有夸大宣傳,即便StarCoder做到了它所宣稱的一切,上限也只不過是一個程序員的助手,而非代替程序員。這與Midjourney、Stable Diffusion在一定程度上代替畫家,有著本質的區別。

目前StarCoder2的技術文檔并沒有公開,但從它的上一代產品StarCoder就能一窺該LLMs系列模型的特質。作為將大語言模型集成至編程領域代表的StarCoder,其訓練模式與傳統的大語言模型并沒有什么區別,無非就是訓練ChatGPT、文心一言這類大模型主要是使用各種文字內容,而StarCoder的語料則是代碼。

這也就意味著StarCoder與ChatGPT、文心一言沒有本質上的區別,前者更像是一個專精于細分場景的大模型,而這一類代碼大模型目前能做到的就是自動補全代碼、根據指令修改代碼,以及用自然語言解釋代碼片段等任務。

3.png

要知道,目前一眾大語言模型最大的命門就是缺乏自我糾正的能力,無論是作為AI聊天機器人的ChatGPT、文生圖的Stable Diffusion,還是文生視頻的Sora都無法規避幻覺,它們可能會生成一大段不同風格天馬行空般的囈語。如今能看到的用ChatGPT作詩、用Stable Diffusion作畫,乃至用Sora生成視頻,其實都離不開人來篩選和修正其中可用的一段。而這背后的含義,就是目前的AIGC還不是智能體、更不是AGI,而像是一種對于人類輸出能力的模仿。

以目前應用AIGC最為成熟的游戲美術領域為例,游戲廠商通常采用的工作流是用AI出一個底稿,然后由人工來增加細節、并糾偏,再將修改過的畫面重新輸入AI大模型,然后重復多次,直至打磨出能用的作品。指望AI一次就做成可以商用的圖片,至少現階段是不現實的一件事。然而這樣的工作模式放在編程領域就不那么好使了,因為使用StarCoder2其實就相當于是接手別人的代碼、并debug。

4.png

但這幾乎可以說是程序員最不喜歡做的事情之一,特別是沒有注釋的代碼。因為你不可能清晰明了地了解他人代碼的整體設計思想及理念,所以能讓代碼跑起來就已經不錯了,再加上缺失了相關注釋,debug簡直就是一件災難性的工作。因此如今即便已經是程序員的用戶,對于代碼模型的使用都很謹慎,基本也不會考慮直接用大模型生成用于生成環境的代碼。

03

至于說有了StarCoder2人人都能成為程序員,這就更難實現了。用自然語言生成代碼其實早在GitHub的Copilot Chat上就已經實現,可又多少人僅僅靠著Copilot Chat就能敲開程序員生涯的大門呢?其實編程是一門與計算機對話的學問,C++、Java、PHP等語言則是代碼世界的“英語”、“漢語”、“法語”。但程序員真正的競爭力并不是代碼編得又快又好,而是能否把現實世界中的需求,清晰地翻譯到抽象的觀念世界。

5.png

這種能力,就是產品經理與開發這兩大互聯網公司中常見職位的標志性差異,而沒有受過計算機科學培訓的人最缺乏的往往就是抽象能力。不過盡管程序員暫時還不需要像畫師一般擔憂自己的工作馬上就會被AI搶走,可StarCoder2等代碼大模型的出現,就代表著相關廠商一直在嘗試削弱程序員群體的議價權,這顯然不是一個好兆頭。


weidian.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 真实国产精品视频国产网 | 免费观看一区二区 | 欧美三级美国一级 | 国产全部理论片线观看 | 综合亚洲欧美日韩一区二区 | 成年免费观看 | 欧美一区二区三区精品国产 | 无套内谢孕妇毛片免费看 | 久久99精品九九九久久婷婷 | 中文字幕在线欧美 | 97国产在线视频公开免费 | 5级做人爱c视版免费视频 | 欧美一级毛片免费高清aa | 欧美性色生活片免费播放 | 亚洲精品一区二区在线观看 | a欧美视频| 男人天堂怡红院 | 亚洲国产情侣一区二区三区 | 毛茸茸年轻成熟亚洲人 | 免费一级欧美在线观看视频片 | 不卡一区在线观看 | 欧美一级xxxx俄罗斯一级 | 一级特黄特色的免费大片视频 | 免费看特黄特黄欧美大片 | 亚洲伊人色综合网站小说 | 欧美成人午夜毛片免费影院 | 亚洲理论在线观看 | 性xxx69xxx视频在线观看 | 九九大香尹人视频免费 | 一级毛片美国一级j毛片不卡 | 中文字幕在线一区二区三区 | 99久免费精品视频在线观看2 | 成人a在线观看 | 欧美日韩第二页 | 国产伦精品一区二区三区 | 九九在线视频 | 久久国产精品久久久久久 | 中文字幕在线观看日韩 | 久国产| 一级特黄牲大片免费视频 | 亚洲人成毛片线播放 |