亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

阿里“破芯”之路:一場不能輸?shù)目萍纪粐鷳?zhàn)

2025-09-05 22:35:32

大模型時代,AI芯片成大型AI廠商競爭力關(guān)鍵,阿里此時自研AI芯片恰逢其時。當(dāng)前,DSA定制化與通信彌補(bǔ)單卡算力短板成趨勢,阿里也趕上這波風(fēng)潮。同時,阿里從服務(wù)器芯片入手,逐漸增加自研比例,基于RISC-V架構(gòu)構(gòu)建AI硬件底層競爭力。不過,阿里利用RISC-V架構(gòu)研發(fā)推理芯片也面臨生態(tài)等挑戰(zhàn),若成功,國產(chǎn)芯片制造及光模塊廠商或迎來大發(fā)展。

每經(jīng)記者|朱成祥    每經(jīng)編輯|張益銘    

在大模型時代,擁有的AI(人工智能)芯片數(shù)量,決定了一家AI廠商的競爭力。

如今,阿里也被曝出正自研AI芯片。顯然,在這一輪科技產(chǎn)業(yè)變革中,AI芯片已經(jīng)成為大型AI廠商的“必答題”。

沒有足夠的AI芯片,就無法為未來海量增長的大模型應(yīng)用提供算力支持;沒有足夠的AI芯片,也就難以通過規(guī)模定律,在大模型訓(xùn)練中占據(jù)有利位置;沒有足夠的AI芯片,無論是大模型還是云計算,都將成為沒有根基的“無本之木”。

阿里選擇“破局”AI芯片,恰逢其時。算力不夠,數(shù)量來湊。目前,國產(chǎn)算力廠商、云基礎(chǔ)設(shè)施廠商普遍通過“通信”來彌補(bǔ)單卡算力的不足,從而實(shí)現(xiàn)兩顆乃至多顆國產(chǎn)算力卡達(dá)到英偉達(dá)一顆算力卡的效果,即“兩卡打一卡”。

在這場不能輸?shù)目萍纪粐鷳?zhàn)中,阿里憑借國內(nèi)諸多廠商的努力,已占得先機(jī)。

大模型需求爆發(fā),呼喚AI算力支持

在云計算時代,阿里云是國內(nèi)市場的絕對領(lǐng)導(dǎo)者。進(jìn)入大模型時代,阿里又迅速以“通義千問”系列產(chǎn)品躋身第一梯隊。

國際市場調(diào)研機(jī)構(gòu)沙利文報告顯示,2025年上半年,中國企業(yè)級市場大模型的日均總消耗量為10.2萬億Tokens(文本處理的最小單位?),其中,阿里通義占比17.7%位列第一,成為目前中國企業(yè)選擇最多的大模型。

然而,大模型的競賽遠(yuǎn)未到終局。當(dāng)大模型從文本大模型走向多模態(tài),決定未來市場格局的關(guān)鍵,正從算法層面向更底層的硬件基礎(chǔ)設(shè)施下沉。

目前,Scaling Law(規(guī)模定律)仍在生效,擁有更多的AI算力,將有助于在大模型訓(xùn)練中占據(jù)優(yōu)勢。此外,在推理側(cè),大模型應(yīng)用已經(jīng)開始爆發(fā)。

阿里云收入的大增即證明了這一點(diǎn)。根據(jù)阿里巴巴財務(wù)報告,2025年4月至6月,阿里云實(shí)現(xiàn)超預(yù)期增長,季度收入同比漲26%至333.98億元,增速創(chuàng)3年新高。

而為了應(yīng)對未來的訓(xùn)練、推理需求增長,各大廠商都在加大AI算力的“軍備競賽”。據(jù)中郵證券研報,微軟2025年第二季度(2025財年第四財季)資本開支為242億美元,同比增長27%,目前,微軟正在加速建設(shè)數(shù)據(jù)中心,以滿足對AI訓(xùn)練和工具激增的市場需求。公司預(yù)計,2026財年第一財季有望將資本開支提升至300億美元以上。

谷歌原本預(yù)計2025年資本開支為750億美元,由于云產(chǎn)品和服務(wù)的需求強(qiáng)勁且不斷增長,其將2025年資本開支上調(diào)至850億美元。

8月29日,阿里發(fā)布2026財年第一財季報告,該季度資本開支為386.76億元,同比增長220%,超市場預(yù)期,創(chuàng)歷史新高,并重申未來三年持續(xù)投入3800億元用于AI資本開支的計劃。

而這些資本開支很大程度上用于AI算力。根據(jù)頭豹研究院數(shù)據(jù),2020年至2027年,中國智能算力呈現(xiàn)爆發(fā)式增長,預(yù)計將從75EFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù))躍升至1117EFLOPS,年均復(fù)合增速超60%,成為推動整體算力擴(kuò)張的核心力量。

契機(jī):定制化大潮、以通信彌補(bǔ)單卡算力短板

近期,A股最為火熱的股票,當(dāng)屬DSA(專用微架構(gòu))芯片廠商寒武紀(jì),以及光模塊廠商“易中天”(指新易盛、中際旭創(chuàng)和天孚通信)。

而這些股票受到資本市場青睞的本質(zhì),一方面是DSA更適合定制化,推理的單位成本更低;另一方面,是以通信彌補(bǔ)單卡算力不足。簡單說,由于制程工藝等因素影響,國內(nèi)廠商在單卡算力上難以追上英偉達(dá)H100。不過,AI算力從來都不是單打獨(dú)斗,可以通過增加通信投入來彌補(bǔ)單卡算力不足的缺陷。

如今,阿里自研芯片,也趕上了這波風(fēng)潮。

隨著大模型的發(fā)展,推理需求的增加,定制化較強(qiáng)的DSA是否更受歡迎呢?

PPIO派歐云工作人員告訴《每日經(jīng)濟(jì)新聞》記者:“LLM(大語言模型)推理,大家更愿意為‘單模型專用’DSA買單;只要編譯器透明、能跑PyTorch2.1,就算只能干編碼或推薦兩件事,1.8至2.3倍能效比即可?!?/p>

云服務(wù)廠商優(yōu)刻得架構(gòu)技術(shù)中心總監(jiān)劉華對《每日經(jīng)濟(jì)新聞》記者表示:“這是肯定的。準(zhǔn)確地說是分工演化,最近很?的一件事,就是字節(jié)采購國內(nèi)某廠商加速卡?來推理,?且這個路徑已經(jīng)有??驗(yàn)證過了,?如谷歌的TPU在BERT和DeepMind模型推理,AWS的Inferentia在Alexa上的推理?!?/p>

劉華具體解釋:“DSA的優(yōu)勢在于特定任務(wù)極致的效率和極低的功耗,其設(shè)計?就舍棄通?性,專?針對AI訓(xùn)練和推理,DSA只會選擇訓(xùn)練和推理的關(guān)鍵算?(例如:矩陣乘GEMM、卷積Conv、Attention)做硬件電路級優(yōu)化。因此,?前做訓(xùn)練?檻會稍微??些?!?/p>

可以看出,定制化的DSA相較于GPGPU(通用圖形處理器),在推理領(lǐng)域效率更高、功耗更低。而未來AI算力市場主要看推理,在優(yōu)刻得看來,隨著AI的?泛應(yīng)?,推理和訓(xùn)練的?例?概是7:3,甚?是9:1。

另外,隨著大模型的發(fā)展,對算力密度有著更高的要求。為此,有Scale up(縱向拓展)和Scale out(橫向拓展)兩種方式。國產(chǎn)廠商正在通過Scale out來彌補(bǔ)單卡算力的不足。

PPIO派歐云工作人員告訴記者:“英偉達(dá)NVLink5把576卡拼成‘一臺大機(jī)’,訓(xùn)練帶寬14.4TB/s;國產(chǎn)卡單芯弱30%至50%,靠1.6Tbps以太網(wǎng)Scale out可彌補(bǔ),達(dá)到128卡約等于64卡H100的水平?!?/p>

其認(rèn)為,當(dāng)國產(chǎn)算力芯片達(dá)到英偉達(dá)單卡性能一半時,還可以通過(通信)網(wǎng)絡(luò)彌補(bǔ)。當(dāng)性能不足一半時,網(wǎng)絡(luò)也救不了,還得卷單卡性能。

不過,Scale out也增加了對光模塊的需求。華為昇騰384超節(jié)點(diǎn)就需要6912個光模塊。

劉華表示:“英偉達(dá)發(fā)現(xiàn)Scale up會面臨越來越多的挑戰(zhàn),比如散熱、距離墻等,因此在2025年CES(國際消費(fèi)類電子產(chǎn)品展覽會)上,英偉達(dá)提出CPO(共封裝光學(xué))的概念,就是要解決Scale out的問題。不過,Scale out也存在‘通信墻’的問題,對于訓(xùn)練參數(shù)數(shù)量巨大的基礎(chǔ)模型,內(nèi)部數(shù)據(jù)通信量是天文數(shù)字,通信開銷會急劇增加,有效計算時間占比下降?!?/p>

利刃——達(dá)摩院平頭哥,RISC-V陣營的“中國旗手”

大模型對AI算力的龐大需求,DSA的發(fā)展和Scale out的進(jìn)步,降低了國產(chǎn)AI算力的供給難度。阿里此時推出AI推理芯片,可謂恰逢其時。

事實(shí)上,阿里在AI算力芯片領(lǐng)域已經(jīng)籌劃多年,且正在打造開源生態(tài)系統(tǒng)。

2017年,阿里成立達(dá)摩院。2018年,達(dá)摩院建立玄鐵團(tuán)隊,并于2019年推出基于RISC-V架構(gòu)的玄鐵處理系列產(chǎn)品。

如今,玄鐵已經(jīng)打造了多款基于RISC-V架構(gòu)的芯片產(chǎn)品。

業(yè)內(nèi)人士對《每日經(jīng)濟(jì)新聞》記者表示:“服務(wù)器芯片中,除算力芯片,CPU物料成本占比約8%至10%,其次DDR5內(nèi)存,占比為6%~8%,而NVMe SSD (NVMe標(biāo)準(zhǔn)的固態(tài)硬盤)4%~6%,400/800G網(wǎng)卡+交換合計5%;電源散熱液冷再分5%~7%,CPU+內(nèi)存+存儲仍是BOM(物料清單)三座大山?!?/p>

劉華也對記者表示:“服務(wù)器芯片中,除了算力芯片外,CPU(中央處理器)、內(nèi)存、存儲占比最高。在沒有GPU(圖形處理器)的服務(wù)器?,CPU占到總成本的20%至60%,特別是HPC(高性能計算)的?密集計算?甚?能占到60%。其次就是內(nèi)存和存儲了,在內(nèi)存密集型應(yīng)?(如?型數(shù)據(jù)庫、內(nèi)存計算)的服務(wù)器中,內(nèi)存的成本甚?能超過CPU,?在存儲服務(wù)器中,?量SSD(固態(tài)硬盤)或全閃存儲是主要的成本構(gòu)成部分?!?/p>

阿里開始從這些芯片入手,逐漸增加服務(wù)器芯片自研比例。CPU芯片方面,2019年,達(dá)摩院推出玄鐵C910,主頻達(dá)2.5GHz;2023年11月,玄鐵推出迭代版本C920,主頻提升至3GHz;2025年2月,玄鐵又推出其首款服務(wù)器級CPU玄鐵C930,并于3月份開始交付。

內(nèi)存方面,國內(nèi)有長鑫;存儲顆粒方面,國內(nèi)有長存。因此,阿里又把自研的方向?qū)?zhǔn)了SSD主控。

據(jù)達(dá)摩院旗下平頭哥半導(dǎo)體透露,2025年3月,鎮(zhèn)岳510已經(jīng)在阿里云的EBS(塊級存儲解決方案)規(guī)?;暇€。該產(chǎn)品能夠在同等資源條件下,幫助阿里云EBS客戶承載更多訪問量,間接實(shí)現(xiàn)降本增效。

北京得瑞領(lǐng)新科技有限公司也依托鎮(zhèn)岳510開發(fā)了其首款支持PCIe5.0接口的高性能NVMe SSD——D8000系列。借助鎮(zhèn)岳510帶來的提升,D8000系列產(chǎn)品性能功耗比較得瑞的上一代產(chǎn)品(PCIe4.0)提升70%以上,可滿足AI訓(xùn)練、實(shí)時數(shù)據(jù)分析等需求。

鎮(zhèn)岳510,正是采用平頭哥自研的芯片架構(gòu),內(nèi)置玄鐵R910 RISC-V多核CPU系統(tǒng),最高頻率1.6GHz。

阿里基于RISC-V架構(gòu),逐漸覆蓋服務(wù)器級CPU和SSD主控。但其真正目標(biāo),仍是AI服務(wù)器皇冠上的寶石——AI算力芯片。

在2025玄鐵RISC-V生態(tài)大會上,達(dá)摩院首席科學(xué)家、知合計算CEO(首席執(zhí)行官)孟建熠就表示,當(dāng)前算力基礎(chǔ)是以GPGPU(CUDA)為代表的傳統(tǒng)閉源硬件與生態(tài),隨著DeepSeek、Llama、Grok等開源大模型不斷涌現(xiàn),給算力架構(gòu)帶來了新機(jī)會。

孟建熠認(rèn)為,隨著開源RISC-V架構(gòu)快速發(fā)展,重新自研架構(gòu)已意義不大,以RISC-V為基礎(chǔ)構(gòu)建處理芯片是未來的主流。RISC-V在AI領(lǐng)域具備很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核產(chǎn)品或者近內(nèi)存計算。

而達(dá)摩院已經(jīng)準(zhǔn)備推出基于RISC-V架構(gòu)的多款芯片產(chǎn)品,并在2025年2月公布了C908X、R908A和XL200等玄鐵處理器家族新成員的研發(fā)計劃。其中,C908X針對AI加速;R908A針對車載;而XL200提供更大規(guī)模、更高性能的多簇一致性互聯(lián)。

可以看出,從服務(wù)器CPU到SSD主控,從AI加速到車載芯片、互聯(lián)芯片,阿里正在基于RISC-V架構(gòu)構(gòu)建AI硬件底層競爭力。

AI推理可分為云側(cè)推理和邊緣側(cè)推理。與云側(cè)追求算力規(guī)模不同,邊緣側(cè)更加追求算力與需求適配,而這正符合RISC-V的特性。

與非研究院資深行業(yè)分析師張慧娟對記者表示:“RISC-V指令集非常精簡、高效,它是模塊化的,又具有擴(kuò)展性?!?/p>

特普斯微電子市場總監(jiān)杜云海認(rèn)為:“RISC-V的崛起并非偶然,其開源指令集架構(gòu)的特性早已為邊緣AI的爆發(fā)埋下伏筆。作為一種可擴(kuò)展、模塊化的架構(gòu),并在專用微架構(gòu)(DSA)等技術(shù)支持下,可支持廠商根據(jù)具體AI工作負(fù)載定制指令集,例如通過向量擴(kuò)展提升并行計算能力,這恰恰契合了邊緣設(shè)備對算力‘按需分配’的核心訴求?!?/p>

阿里的挑戰(zhàn)及產(chǎn)業(yè)鏈機(jī)會

不過,利用RISC-V架構(gòu)研發(fā)推理芯片也存在不少挑戰(zhàn),而最大的挑戰(zhàn)莫過于生態(tài)。

正如蓉和半導(dǎo)體咨詢CEO吳梓豪所言:“RISC-V關(guān)鍵是沒有生態(tài),不是說設(shè)計出一顆芯片,就能使用起來。它需要匹配的生態(tài)、驅(qū)動。”

而阿里也正在補(bǔ)上RISC-V生態(tài)方面的短板。2024年3月,達(dá)摩院宣布發(fā)起成立“無劍聯(lián)盟”,通過構(gòu)建開放、協(xié)同、普惠的RISC-V芯片服務(wù)體系,加速RISC-V產(chǎn)業(yè)化進(jìn)程。據(jù)悉,成員將基于玄鐵處理器緊密推進(jìn)IP(網(wǎng)際互連協(xié)議)協(xié)同、工具鏈優(yōu)化、操作系統(tǒng)適配、解決方案拓展、應(yīng)用推廣等工作。

若阿里自研的推理芯片得到大規(guī)模應(yīng)用,國產(chǎn)芯片制造及光模塊廠商或?qū)⒌玫酱蟀l(fā)展。

目前,國內(nèi)晶圓代工領(lǐng)域主要廠商為中芯國際、華虹公司和晶合集成,而擁有先進(jìn)制程代工能力的,唯有中芯國際。

同時,Scale up領(lǐng)域代表是英偉達(dá),而英偉達(dá)主要通過銅纜互聯(lián)。TrendForce集邦咨詢分析師儲于超告訴《每日經(jīng)濟(jì)新聞》記者:“以英偉達(dá)的技術(shù)來說,目前Scale up采用銅纜,主要還是因?yàn)榈脱舆t傳輸信號的考量,而不是成本。”

而國內(nèi)廠商很多采用Scale out提升算力密度。儲于超表示:“隨著傳輸速度與數(shù)據(jù)量增加,Scale out會依賴800G/1.6T光模塊,甚至是下一代的CPO?!?/p>

封面圖片來源:圖片來源:視覺中國-VCG211478193393

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0