每日經濟新聞 2025-03-24 17:23:20
每經編輯|金冥羽
近日,螞蟻集團Ling團隊發(fā)表了一篇技術成果論文。論文顯示,螞蟻集團推出了兩款不同規(guī)模的MoE大語言模型——百靈輕量版(Ling-Lite)與百靈增強版(Ling-Plus),前者參數(shù)規(guī)模為168億(激活參數(shù)27.5億),Plus基座模型參數(shù)規(guī)模高達2900億(激活參數(shù)288億),兩者性能均達到行業(yè)領先水平。
除了自研性能領先的大模型以外,該技術論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實驗表明,其3000億參數(shù)的MoE(混合專家)大模型可在使用國產GPU的低性能設備上完成高效訓練,性能與完全使用英偉達芯片、同規(guī)模的稠密模型及MoE模型相當。
目前,螞蟻集團Ling團隊的技術成果論文《每一個FLOP都至關重要:無需高級GPU即可擴展3000億參數(shù)混合專家LING大模型》已發(fā)表在預印版Arxiv平臺上。
此前,DeepSeek通過一系列算法創(chuàng)新及工程優(yōu)化,使用性能較低的英偉達H800訓練出了性能與頂尖模型相當?shù)腣3與R1,為大模型的訓練開辟了新的道路,讓更多的企業(yè)和研究機構看到了降低成本、提高效率的可能性。如果螞蟻集團的技術成果得到驗證及推廣,意味著國產大模型能夠尋找成本更低、效率更高的國產芯片或其他替代方案,以進一步降低對英偉達芯片的依賴。
根據(jù)國泰君安證券研報,AI芯片主要分為三種類型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)。三類芯片代表分別有英偉達(NVIDIA)的GPU、賽靈思的FPGA和Google的TPU(一種專門為機器學習任務設計的AI ASIC)。GPU的計算能力最強,但是成本高、功耗高;FPGA可編程,最靈活,但是計算能力不強;ASIC體積小、功耗低,適合量產,但是研發(fā)時間長,且不可編輯,前期投入成本高,帶來一定的技術風險。
目前,國內GPU廠商代表有壁仞科技、天智數(shù)芯、摩爾線程和沐曦等;AI ASIC廠商代表有華為海思昇騰、寒武紀、燧原股份等。
2024年8月以來,國內AI算力廠商陸續(xù)啟動IPO輔導。2024年8月26日,AI ASIC領域代表廠商燧原科技啟動IPO輔導;GPGPU領域代表廠商壁仞科技于9月11日啟動IPO輔導;11月12日,GPU廠商摩爾線程啟動IPO輔導。
進入2025年,1月15日,沐曦股份也啟動了上市輔導。若四家全部上市成功,將大幅擴展A股AI算力廠商投資標的的供給。
這幾家接受IPO輔導的企業(yè)中,燧原科技創(chuàng)始團隊有AMD背景,其創(chuàng)始人兼COO張亞林于2008年加入AMD,歷任資深芯片經理、技術總監(jiān)。曾經作為全球芯片研發(fā)主要負責人之一,在AMD上海研發(fā)中心成功領導開發(fā)并量產了多顆世界級芯片,擁有豐富的工程和產品化實戰(zhàn)經驗。
沐曦股份創(chuàng)始團隊同樣來自AMD,其創(chuàng)始人陳維良曾任AMD全球GPGPU設計總負責人;兩位CTO(首席技術官)均為前AMD首席科學家,目前分別負責公司軟硬件架構。
而摩爾線程創(chuàng)始團隊來自全球GPU巨頭英偉達,其創(chuàng)始人兼CEO張建中曾任英偉達全球副總裁、中國區(qū)總經理,在GPU這一行業(yè)已經深耕近二十年。
除了這四家接受IPO輔導的廠商外,天數(shù)智芯、昆侖芯、平頭哥等廠商也廣受市場關注。
(文章內容和數(shù)據(jù)僅供參考,不構成投資建議。投資者據(jù)此操作,風險自擔。)
編輯|金冥羽 蓋源源 杜恒峰
校對|程鵬
每日經濟新聞綜合自證券時報、券商中國、公開資料等
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP