8 月 9 日消息,阿里通義千問 Qwen2 開源家族迎來新成員 Qwen2-Math,共有 15 億參數、70 億參數和 720 億參數三個版本,是基于 Qwen2 LLM 構建、專門用于數學解題的語言模型。
簡介
Qwen2-Math 是一系列基于 Qwen2 LLM 構建的專門用于數學解題的語言模型,其數學能力顯著超越了開源模型,甚至超過了閉源模型(如 GPT-4o),官方希望為科學界解決需要復雜多步邏輯推理的高級數學問題做出貢獻。
性能
團隊在一系列數學基準評測上評估了我們的數學專用模型 Qwen2-Math。在 Math 上的評測結果表明,其最大的數學專用模型 Qwen2-Math-72B-Instruct 超越了最先進的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。
Qwen2-Math 指令微調模型
正開發多語言模型
從報道中獲悉,新模型系列 Qwen2-Math 專注于數學能力,目前僅支持英文,團隊計劃推出支持英文和中文的雙語模型,并且開發多語言模型。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]。