亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

阿里云AI成果入選頂會(huì),GPU用量削減82%

2025-10-19 15:01:20

阿里云計(jì)算池化方案“Aegaeon”入選頂級(jí)學(xué)術(shù)會(huì)議SOSP 2025,解決GPU資源浪費(fèi)問(wèn)題,提升利用率,核心技術(shù)已應(yīng)用于百煉平臺(tái)。在測(cè)試中,該系統(tǒng)削減GPU用量82%,降低硬件成本。Aegaeon支持單GPU服務(wù)多模型,提升吞吐量。阿里云CEO吳泳銘宣布將推進(jìn)AI基建,升級(jí)全棧AI體系,打造全棧人工智能服務(wù)商,迎接超級(jí)人工智能時(shí)代到來(lái)。

每經(jīng)編輯|畢陸名    

近日,阿里云提出的計(jì)算池化解決方案“Aegaeon”成功入選頂級(jí)學(xué)術(shù)會(huì)議SOSP 2025,該方案可解決AI模型服務(wù)中普遍存在的GPU資源浪費(fèi)問(wèn)題,大幅提升GPU資源利用率,目前其核心技術(shù)已應(yīng)用在阿里云百煉平臺(tái)。

SOSP(操作系統(tǒng)原理研討會(huì))由ACM SIGOPS主辦,是計(jì)算機(jī)系統(tǒng)領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議,平均每年收錄的論文數(shù)量?jī)H有數(shù)十篇,被譽(yù)為計(jì)算機(jī)操作系統(tǒng)界的“奧斯卡”,入選論文代表了操作系統(tǒng)和軟件領(lǐng)域最具代表的研究成果。本屆SOSP大會(huì)上,系統(tǒng)軟件與AI大模型技術(shù)的融合成為新的趨勢(shì)。

數(shù)據(jù)顯示,在阿里云模型市場(chǎng)為期超三個(gè)月的Beta測(cè)試中,Aegaeon系統(tǒng)在服務(wù)數(shù)十個(gè)參數(shù)量高達(dá)720億的大模型時(shí),所需的英偉達(dá)H20 GPU數(shù)量從1192個(gè)減至213個(gè),削減比例高達(dá)82%(見(jiàn)下圖)。GPU用量削減82%意味著公司硬件采購(gòu)成本將顯著降低,這對(duì)于動(dòng)輒使用成千上萬(wàn)張GPU的大型模型服務(wù)商至關(guān)重要。

在真實(shí)的模型服務(wù)場(chǎng)景中,少數(shù)熱門(mén)模型(如阿里的Qwen)承載了絕大多數(shù)用戶(hù)請(qǐng)求,而大量不常被調(diào)用的“長(zhǎng)尾”模型卻各自獨(dú)占著GPU資源。數(shù)據(jù)顯示,在阿里云模型市場(chǎng)中,曾有17.7%的GPU算力僅用于處理1.35%的請(qǐng)求,資源閑置嚴(yán)重。

而Aegaeon系統(tǒng)通過(guò)GPU資源池化,打破了“一個(gè)模型綁定一個(gè)GPU”的低效模式。

Token級(jí)調(diào)度是該系統(tǒng)的核心創(chuàng)新點(diǎn),Aegaeon多模型混合服務(wù)系統(tǒng)在每次生成下一個(gè)token后動(dòng)態(tài)決定是否切換模型,實(shí)現(xiàn)精細(xì)化管理,同時(shí),通過(guò)組件復(fù)用、顯存精細(xì)化管理和KV緩存同步優(yōu)化等全棧技術(shù),Aegaeon將模型切換開(kāi)銷(xiāo)降低97%,確保了token級(jí)調(diào)度的實(shí)時(shí)性,可支持亞秒級(jí)的模型切換響應(yīng)。

據(jù)介紹,Aegaeon系統(tǒng)支持單GPU同時(shí)服務(wù)多達(dá)7個(gè)不同模型,相比現(xiàn)有主流方案提升1.5-9倍的有效吞吐量,實(shí)現(xiàn)2-2.5倍的請(qǐng)求處理能力。

如何從底層系統(tǒng)軟件層面優(yōu)化,以更好地支撐和賦能上層AI應(yīng)用,已成為全球?qū)W術(shù)界和工業(yè)界關(guān)注的焦點(diǎn)。未來(lái)AI的發(fā)展將不僅依賴(lài)于硬件算力的單純?cè)鲩L(zhǎng),更需要通過(guò)系統(tǒng)級(jí)的軟件創(chuàng)新來(lái)深度挖掘現(xiàn)有硬件的潛力。

9月24日,在2025云棲大會(huì)上,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘明確闡述了AI時(shí)代下阿里云的核心戰(zhàn)略。

他表示大模型是下一代操作系統(tǒng),而AI云是下一代計(jì)算機(jī)?!按竽P蛯⑷〈鷤鹘y(tǒng)OS,成為連接用戶(hù)、軟件與AI計(jì)算資源的中間層。”

他宣布,公司正積極推進(jìn)3800億元的AI基礎(chǔ)設(shè)施建設(shè),并計(jì)劃追加更大投入。到2032年,阿里云全球數(shù)據(jù)中心的能耗規(guī)模將比2022年提升10倍。

這一目標(biāo)預(yù)示著阿里云算力投入將指數(shù)級(jí)增長(zhǎng),為迎接超級(jí)人工智能(ASI)時(shí)代做準(zhǔn)備。此前公布的2025財(cái)年第二季度財(cái)報(bào)顯示,阿里云智能集團(tuán)收入同比增長(zhǎng)26%,創(chuàng)下近三年最高增速。公司整體凈利潤(rùn)同比增長(zhǎng)76%,表明AI投入已開(kāi)始產(chǎn)生實(shí)效。

吳泳銘在演講中表示,通用人工智能(AGI)已是確定性事件,但這只是起點(diǎn),終極目標(biāo)是發(fā)展出能自我迭代、全面超越人類(lèi)的超級(jí)人工智能(ASI)。

“AI時(shí)代,大模型將是下一代操作系統(tǒng),超級(jí)AI云是下一代計(jì)算機(jī)?!眳怯俱懻f(shuō),超級(jí)AI云需要超大規(guī)模的基礎(chǔ)設(shè)施和全棧的技術(shù)積累,未來(lái),全世界可能只會(huì)有5—6個(gè)超級(jí)云計(jì)算平臺(tái)。阿里云將持續(xù)加大投入,迎接超級(jí)人工智能時(shí)代到來(lái)。

吳泳銘宣布阿里云重磅升級(jí)全棧AI體系,實(shí)現(xiàn)從AI大模型到AI基礎(chǔ)設(shè)施的技術(shù)更新。阿里云將全力打造成為全棧人工智能服務(wù)商。

為了迎接ASI時(shí)代的到來(lái),對(duì)比2022年,2032年阿里云全球數(shù)據(jù)中心的能耗規(guī)模將提升10倍。這意味著阿里云算力投入將指數(shù)級(jí)提升。

當(dāng)下,在AI基礎(chǔ)設(shè)施上,阿里云圍繞AI進(jìn)行了軟硬全棧的協(xié)同優(yōu)化和系統(tǒng)創(chuàng)新,已初步形成以通義為核心的操作系統(tǒng)和以AI云為核心的下一代計(jì)算機(jī)。過(guò)去一年,阿里云AI算力增長(zhǎng)超5倍,AI存力增長(zhǎng)4倍多。

每日經(jīng)濟(jì)新聞綜合公開(kāi)信


封面圖片來(lái)源:視覺(jué)中國(guó)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線(xiàn):4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0