人工智能相關文章 DeepSeek開源周第二日:開源首個用于MoE模型訓練通信庫 今天是DeepSeek開源周第二日,一早,DeepSeek如約就放出了開源代碼庫DeepEP王炸。 據了解,DeepEP是首個用于 MoE 模型訓練和推理的開源 EP 通信庫,它填補了MoE模型專用通信工具的空白,為大規模分布式AI訓練和實時推理場景提供了更高效的底層支持。 發表于:2/25/2025 上海明星AI公司瀾碼科技被曝員工停薪社保停繳 2 月 25 日消息,據極速財訊報道,曾頂著“李開復關門弟子”、“ACM 世界冠軍”光環的周健和他的明星 AI 公司瀾碼科技現在陷入輿論漩渦。 發表于:2/25/2025 Anthropic發布全球首個混合推理模型Claude 3.7 Sonnet 2月25日消息,據報道,Anthropic發布了全球首款混合推理模型、迄今為止最好的編碼模型——Claude 3.7 Sonnet。 據官方介紹,該模型以其獨特的“一個模型,兩種思考方式”(One model, two ways to think)設計理念,為用戶提供了標準和擴展兩種思考模式,允許用戶根據需求靈活選擇模型的響應方式:既可以是近乎即時的快速回答,也可以是經過深度思考的逐步推理結果。 發表于:2/25/2025 微軟回應大砍算力AI傳聞 本周一,微軟重申將堅持其800多億美元的資本支出計劃,但同時承認可能會在某些領域戰略性地調整或放緩基礎設施建設。 此前報道稱,TD Cowen分析師近日發布報告指出,微軟已經取消了與多個私營數據中心運營商的數項租賃協議,涉及功率總計數百兆瓦。TD Cowen認為,這些舉動表明,微軟可能正處于數據中心“供應過剩”的局面。 發表于:2/25/2025 兆芯全系整機成功部署DeepSeek-R1 2月24日消息,兆芯官方宣布,基于兆芯處理器的PC筆記本/臺式機終端、工作站、服務器,已經全系成功實現DeepSeek-R1 Distill模型的本地部署,涵蓋1.5B、7B、14B、32B、70B、671B等各種參數規模。 操作系統方面,兆芯原生支持Linux、Windows、各家國產操作系統,并適配國產GPU AI加速卡。 發表于:2/25/2025 阿里宣布未來3年將投入超3800億元用于AI和云計算基礎設施 2月24日,阿里巴巴集團CEO吳泳銘宣布,未來三年,阿里將投入超過3800億元,用于建設云和人工智能(AI)硬件基礎設施,總額將超過去十年總和。這也創下了中國民營企業在云和AI硬件基礎設施建設領域有史以來最大規模投資。 值得注意的是,阿里巴巴此次投資正值兩個重要時間節點:一是DeepSeek火爆全球,帶動國內AI產業快速發展;二是本月17日,民營企業座談會在北京舉行,提振了民營經濟的干勁與信心。 吳泳銘表示,“AI爆發遠超預期,國內科技產業方興未艾,潛力巨大。阿里巴巴將不遺余力加速云和AI硬件基礎設施建設,助推全行業生態發展。”目前,阿里云是亞洲頭部云計算公司,阿里巴巴通義千問大模型已成為全球知名的開源模型。 發表于:2/25/2025 e絡盟擴展產品組合 強化工業產品類別 中國上海,2025 年 2月20日 — 安富利旗下全球電子元器件產品與解決方案分銷商e絡盟擴展了其工業和維護、維修和運營 (MRO) 產品范圍,以確保客戶能夠從行業領先的供應商處獲得各種產品和解決方案。 發表于:2/24/2025 展望2025:人工智能將改變數據中心建設的方式 回望2024,人工智能(AI)對行業產生的影響顯露無疑。去年,數據中心對AI計算的需求呈指數級增長,這將促使行業采用更高效的流程,加快構建速度,并更具創造性地解決問題。如今看來,這一預測不僅成真,而且實際趨勢比我們當初預想的還要顯著。2025年,行業對更高效戰略的需求已經十分明顯。目前,有一些重大的舉措和雄心勃勃的計劃已經成形,數據中心建設的變革將助力云計算繼續進階。 發表于:2/24/2025 DeepSeek今日啟動開源周 2月24日消息,據報道,DeepSeek宣布啟動“開源周”,首個開源的代碼庫為Flash MLA。 這是一個針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計,目前已投入實際生產應用。 發表于:2/24/2025 龍芯DeepSeek大模型推理一體機發布 2 月 23 日消息,據龍芯安徽公眾號,龍芯中科成功發布基于 DeepSeek 大模型的軟硬全棧推理一體機。產品基于龍芯自主指令系統架構(LoongArch)3C5000 處理器,搭載太初元碁 T100 加速卡,支持 DeepSeek 全系大模型及其它主流大模型。 發表于:2/24/2025 超20家央企接入DeepSeek 2 月 24 日消息,據經濟參考報報道,近來,國資央企“牽手”DeepSeek 已成為一股新風潮。據不完全統計,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽車、金融、建筑等多個領域。 發表于:2/24/2025 DeepSeek超越150萬模型成全球最受歡迎開源大模型 2月24日消息,今天凌晨3點,全球最大開源平臺之一huggingface聯合創始人兼首席執行官Clement Delangue發布了最新數據:中國開源大模型DeepSeek-R1在150萬模型中,成為該平臺最受歡迎的開源大模型,點贊超過1萬。 前不久,Clement還特意發文恭喜DeepSeek-R1的下載量超過1000萬次,同樣創造了huggingface平臺有史以來最受歡迎的模型。 發表于:2/24/2025 Arm Ethos-U85 NPU:利用小語言模型在邊緣側實現生成式 AI 隨著人工智能 (AI) 的演進,利用小語言模型 (SLM) 在嵌入式設備上執行 AI 工作負載成為業界關注的焦點。Llama、Gemma 和 Phi3 等小語言模型,憑借其出色的成本效益、高效率以及在算力受限設備上的易部署性,贏得了廣泛認可。Arm 預計這類模型的數量將在 2025 年繼續增長。 發表于:2/23/2025 意法半導體為數據中心和AI集群帶來更高性能的云光互連技術 2025 年 2 月 20 日,中國 —— 服務多重電子應用領域、全球排名前列的半導體公司意法半導體 (STMicroelectronics,簡稱ST;紐約證券交易所代碼:STM) 推出了新一代專有硅光技術,為數據中心和 AI 集群帶來性能更高的光互連解決方案。隨著 AI 計算需求的指數級增長,計算、內存、電源以及這些資源的互連都面臨著性能和能效的挑戰。意法半導體新推出的硅光技術和新一代 BiCMOS 技術可以幫助云計算服務商和光模塊廠商克服這些挑戰。計劃從 2025 年下半年開始,800Gb/s 和 1.6Tb/s 光模塊將逐步提升產量。 發表于:2/23/2025 昆侖芯單機可部署滿血版DeepSeek R1 昆侖芯作為國產高性能AI芯片,是國內率先支持單機部署滿血版DeepSeek R1的國產芯,率先支持 8bit 推理,可提供精度無損的推理服務,單機8卡配置便可實現 2437 tokens/s 吞吐,在性能、功耗和部署靈活性上達到行業領先水平,滿足輕量化與極致效價比需求,業界價格最低! 發表于:2/21/2025 ?…891011121314151617…?