①供給端緊缺狀況緩解,各類計(jì)算卡價(jià)格現(xiàn)已貼近銷售商成本線。 ②智算需求持續(xù)增長(zhǎng),但需求方趨于理性,供需不完全匹配。 ③全國(guó)百余個(gè)智算中心中,算力閑置并非普遍現(xiàn)象。 ④從業(yè)者預(yù)計(jì),部分智算中心三四年左右能夠“回本”。 ⑤首個(gè)高質(zhì)量算力評(píng)估體系發(fā)布,業(yè)內(nèi)希望用更小算力產(chǎn)生更多的智能。
財(cái)聯(lián)社10月2日訊(記者 付靜)大模型參數(shù)規(guī)模持續(xù)增加,對(duì)AI算力基礎(chǔ)設(shè)施提出更高要求,當(dāng)下AI智算行業(yè)蓬勃發(fā)展,智算中心建設(shè)加速。最新數(shù)據(jù)顯示,截至今年6月,全國(guó)在用算力中心機(jī)架總規(guī)模超過(guò)830萬(wàn)標(biāo)準(zhǔn)機(jī)架,算力規(guī)模達(dá)246 EFLOPS(FP32),智算同比增速超過(guò)65%。
現(xiàn)階段供應(yīng)端算卡價(jià)格和緊缺程度如何?供給端與需求端是否相匹配?全國(guó)百余個(gè)智算中心是否都滿負(fù)荷運(yùn)行?建設(shè)智算中心何時(shí)能回本?人工智能算力如何實(shí)現(xiàn)高質(zhì)量發(fā)展?圍繞五個(gè)核心問(wèn)題,財(cái)聯(lián)社記者采訪了多位產(chǎn)業(yè)人士。
據(jù)財(cái)聯(lián)社記者梳理,此前AI算力供給端緊缺的局面有所緩解,但供需兩端不完全匹配,導(dǎo)致部分智算中心利用率較低。各地政府、企業(yè)的智算中心規(guī)劃雖屢見(jiàn)不鮮,真正能落地投入使用的數(shù)量或不及預(yù)期。有從業(yè)者預(yù)計(jì),部分智算中心三四年左右能夠“回本”,與此同時(shí),算力高質(zhì)量發(fā)展亦受業(yè)內(nèi)重視。
算卡價(jià)貼近銷售商成本線
“算力供應(yīng)緊張確實(shí)是這幾年一個(gè)比較普遍的現(xiàn)象,算力能力好、生態(tài)適應(yīng)性較好的產(chǎn)品,確實(shí)是很多人都搶著買。從使用者來(lái)講,當(dāng)然希望智算能力能夠更好地支撐應(yīng)用?!闭驹谒懔Ψ?wù)器供應(yīng)商角度,浪潮云海首席科學(xué)家張東接受財(cái)聯(lián)社記者采訪時(shí)表示。
張東告訴記者,智算供應(yīng)緊張存在周期性。
供給端當(dāng)下?tīng)顩r如何?上海六尺科技集團(tuán)董事長(zhǎng)、恒潤(rùn)股份(603985.SH)子公司上海潤(rùn)六尺科技有限公司總經(jīng)理張亞洲向財(cái)聯(lián)社記者表示, “今年算力市場(chǎng)供應(yīng)是有的,不像去年缺得很,目前各類計(jì)算卡的價(jià)格已經(jīng)貼近銷售商成本線了。現(xiàn)在行業(yè)內(nèi)各種項(xiàng)目參與的人多、中介也多,原來(lái)做電腦做設(shè)備的、ICT通訊行業(yè)的全部‘卷’進(jìn)來(lái),但其實(shí)真正做成、做好的不多?!?/p>
近期,A股部分跨界智算玩家透露出了壓力,如:蓮花控股(600186.SH)旗下蓮花紫星目前已簽署的部分算力服務(wù)合同,可能存在收回采購(gòu)成本實(shí)際所需時(shí)間超出預(yù)期或無(wú)法收回的風(fēng)險(xiǎn),截至今年8月,蓮花紫星仍處于虧損狀態(tài),全年能否盈利存在不確定性;奧雅股份(300949.SZ)全資子公司奧創(chuàng)引擎與供應(yīng)商潤(rùn)信供應(yīng)鏈協(xié)商簽署《算力服務(wù)器采購(gòu)合同補(bǔ)充協(xié)議》,原計(jì)劃采購(gòu)的128臺(tái)內(nèi)嵌英偉達(dá)GPU芯片的高性能運(yùn)算服務(wù)器數(shù)量變更為8臺(tái)。
據(jù)張亞洲觀察,今年6月-8月,GPU終端價(jià)格呈持續(xù)下跌態(tài)勢(shì)。“去年的項(xiàng)目今年上半年都被消化掉了,今年在進(jìn)行的項(xiàng)目主要有兩種情況:一是企業(yè)研發(fā)真正需要算力,主要集中在大型互聯(lián)網(wǎng)公司,二是一些地區(qū)拿了補(bǔ)貼、能源指標(biāo)等配套建設(shè)智算中心?!?/p>
據(jù)了解,9月市場(chǎng)才出現(xiàn)了一波“掃貨”現(xiàn)象,“主要是受淡旺季和國(guó)際環(huán)境影響,但其實(shí)市場(chǎng)現(xiàn)貨資源并不多?!?/p>
記者亦從一位業(yè)內(nèi)人士處獲悉,“之前4090的價(jià)格從一萬(wàn)三千多漲到一萬(wàn)六七千了”,不過(guò)據(jù)稱漲價(jià)主要由于《黑神話:悟空》對(duì)該款顯卡需求較強(qiáng)。
另外張亞洲稱,市場(chǎng)還存在算力供給零散的現(xiàn)象:部分供給方“可能只有5臺(tái)、10臺(tái)服務(wù)器,大一些的是64臺(tái)、100多臺(tái),大批量的基本很少。這種供應(yīng)商可能會(huì)承接一些實(shí)驗(yàn)室、學(xué)校的散單需求?!?/p>
供需兩端不完全匹配
幾位從業(yè)者告訴財(cái)聯(lián)社記者,供給緊缺緩解并不意味著智算需求不及預(yù)期。張亞洲稱,智算需求呈增長(zhǎng)態(tài)勢(shì),且不斷有新的需求產(chǎn)生,不過(guò)當(dāng)下需求方已趨于理性。
深圳人工智能產(chǎn)業(yè)協(xié)會(huì)執(zhí)行會(huì)長(zhǎng)范叢明在接受財(cái)聯(lián)社記者采訪時(shí)談到了不同類型需求方的現(xiàn)狀:頭部企業(yè)、科研高校算力資源充足,而當(dāng)下產(chǎn)業(yè)垂直大模型正在大量研發(fā),中小微企業(yè)算力緊張的情況存在。
值得注意的是,智算中心建設(shè)如火如荼,相關(guān)招投標(biāo)項(xiàng)目逐月遞增。
此前數(shù)智前線報(bào)道,據(jù)不完全統(tǒng)計(jì),僅今年前7個(gè)月,圍繞土建基礎(chǔ)設(shè)施和IT基礎(chǔ)架構(gòu)等方方面面的建設(shè)內(nèi)容,智算中心相關(guān)項(xiàng)目中標(biāo)公告已發(fā)布超140個(gè),其中至少24個(gè)項(xiàng)目中標(biāo)金額超億元;7月國(guó)內(nèi)公布的相關(guān)中標(biāo)項(xiàng)目超40個(gè)。
中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所總工程師郭亮在剛剛落下帷幕的“2024中國(guó)算力大會(huì)”期間接受財(cái)聯(lián)社記者采訪時(shí)表示,“現(xiàn)在全國(guó)建了很多智算中心,據(jù)不完全統(tǒng)計(jì),應(yīng)有200個(gè)以上,但其中有90%的算力在1000P以下,意味著這部分算力中心對(duì)大模型訓(xùn)練來(lái)說(shuō)作用有限,以后的使用效率存疑?!?/p>
“算力需求是很大,只不過(guò)現(xiàn)有類型無(wú)法滿足用戶需求。無(wú)論是適配方面還是性價(jià)比角度,都達(dá)不到客戶的預(yù)期。”IDC中國(guó)分析師杜昀龍對(duì)財(cái)聯(lián)社記者表示。
張亞洲也認(rèn)為,目前存在算力供應(yīng)端和需求端不完全匹配的狀況,“B端需求方一般都會(huì)找自己熟悉的單位。一個(gè)項(xiàng)目可能有幾十個(gè)人過(guò)來(lái)詢價(jià),實(shí)際上只有跟項(xiàng)目方合作關(guān)系良好或者綜合實(shí)力比較受認(rèn)可才可能成交,并不一定是以最低價(jià)成交。”
算力閑置是否普遍?
財(cái)聯(lián)社記者注意到,現(xiàn)階段算力設(shè)備是否滿負(fù)荷運(yùn)行成為市場(chǎng)關(guān)注的焦點(diǎn)。
“現(xiàn)在很多算力已經(jīng)得到了消化,但行業(yè)內(nèi)確實(shí)存在小部分算力閑置的情況,比如說(shuō)市場(chǎng)上可能有千臺(tái)機(jī)器的供應(yīng)量,但可能有幾百臺(tái)機(jī)器在閑置。”張亞洲告訴財(cái)聯(lián)社記者。
據(jù)郭亮觀察,算力閑置并非是普遍現(xiàn)象,“我們團(tuán)隊(duì)支撐了很多省市的相關(guān)工作。近期來(lái)看,據(jù)我們了解,寧夏算力中心的利用率還是很高的。”
“現(xiàn)在比較普遍的是在網(wǎng)上賣內(nèi)蒙古、西藏、新疆的算力,進(jìn)行分時(shí)租賃,價(jià)格便宜,這就會(huì)導(dǎo)致建在廣東等地的智算中心利用率較低。” 范叢明告訴記者。
談及寧夏智算中心,郭亮分析,當(dāng)?shù)卣w電價(jià)現(xiàn)在雖無(wú)補(bǔ)貼,但仍有優(yōu)勢(shì);當(dāng)?shù)刂撬阒行牡乃懔σ?guī)模較大,對(duì)于大模型訓(xùn)練比較有用?!傲硗鈱?duì)于智算來(lái)說(shuō),網(wǎng)絡(luò)傳輸?shù)男阅芤鬀](méi)那么強(qiáng),數(shù)據(jù)完全可以通過(guò)線下的方式進(jìn)行,這對(duì)我國(guó)中西部的智算中心來(lái)說(shuō)是個(gè)比較好的應(yīng)用場(chǎng)景?!?/p>
“從前期建設(shè)的算力消化程度看,頭部企業(yè)應(yīng)該在80%,科研高校應(yīng)該是30%-40%左右,市場(chǎng)化建設(shè)的算力消化程度應(yīng)該在一半左右?!狈秴裁鲗?duì)記者表示。
據(jù)范叢明觀察,字節(jié)、騰訊、華為、百度等頭部企業(yè)“不停訓(xùn)練大模型,數(shù)據(jù)量越大,算力需求越大,幾乎不存在算力閑置情況”;科研高校算力“建得大、用得少”,閑置相對(duì)較多;中小企業(yè)算力閑置則相對(duì)較普遍。由于定位不清、位置偏遠(yuǎn)、價(jià)格過(guò)高,前期建設(shè)的算力消化程度是不夠的?!?/p>
杜昀龍認(rèn)為,算力是否閑置主要看幾個(gè)方面:上層軟件對(duì)算力的調(diào)動(dòng)、硬件之間的互聯(lián)方式、硬件設(shè)施與應(yīng)用場(chǎng)景的適配、用戶部署成本。
9月初,騰訊云副總裁沙開(kāi)波在接受財(cái)聯(lián)社記者采訪時(shí)也談到了智算中心即便具備了硬件資源,但仍缺乏配套軟件能力,缺乏實(shí)際的終端客戶或應(yīng)用場(chǎng)景等現(xiàn)象。
張亞洲稱,算力出現(xiàn)閑置,背后原因較為復(fù)雜,與各類智算卡的性能、項(xiàng)目方的運(yùn)營(yíng)、網(wǎng)絡(luò)產(chǎn)品技術(shù)服務(wù)能力等均有關(guān),而業(yè)內(nèi)的核心關(guān)注點(diǎn)在于應(yīng)用端是否有實(shí)際產(chǎn)出。
建智算中心幾年能回本?
算力閑置導(dǎo)致部分智算中心成本過(guò)高,是業(yè)內(nèi)普遍關(guān)注的問(wèn)題之一。
對(duì)此,范叢明認(rèn)為,智算中心供應(yīng)價(jià)太貴,用戶用不起,就導(dǎo)致智算中心計(jì)算的連續(xù)性不夠,成本過(guò)高。
談及智算中心運(yùn)營(yíng)問(wèn)題,郭亮在“2024中國(guó)算力大會(huì)”期間對(duì)財(cái)聯(lián)社記者表示,“近期大家在各種場(chǎng)合會(huì)經(jīng)常看到算力調(diào)度平臺(tái)的信息,但建了之后效果怎么樣?據(jù)了解,有些地方花了上千萬(wàn)投資建了平臺(tái),因?yàn)樵O(shè)計(jì)理念、功能特色等問(wèn)題,實(shí)際上并沒(méi)有很好地利用起來(lái)。目前全國(guó)還沒(méi)有符合大家需求的平臺(tái)出現(xiàn),而這對(duì)我國(guó)智算中心的整體運(yùn)營(yíng)特別重要?!?/p>
他進(jìn)一步表示,“對(duì)于智算來(lái)說(shuō),即使是政府投資也需要回報(bào),更何況是企業(yè)?,F(xiàn)在業(yè)界確實(shí)是群雄紛爭(zhēng)的局面,但還沒(méi)有一統(tǒng)天下的角色出現(xiàn),當(dāng)然我們也在努力,本次算力大會(huì)發(fā)布的中國(guó)算力服務(wù)平臺(tái)(河南)就是我們推出的一個(gè)解決方案?!?/p>
(財(cái)聯(lián)社記者攝于2024中國(guó)算力大會(huì)現(xiàn)場(chǎng))
關(guān)于智算中心如何平衡成本和性能,范叢明告訴財(cái)聯(lián)社記者,“算力投資回收期一般是五年左右,因?yàn)樗懔κ袌?chǎng)變化太快,還要加上電費(fèi)、運(yùn)營(yíng)等其他成本。如果能找到頭部大廠使用,我覺(jué)得回本時(shí)間大概在三四年左右?!?/p>
杜昀龍則認(rèn)為,智算中心的運(yùn)營(yíng)方應(yīng)制定長(zhǎng)期規(guī)劃,降低最終用戶的使用成本,培養(yǎng)使用習(xí)慣,后期恢復(fù)標(biāo)價(jià);重點(diǎn)培養(yǎng)應(yīng)用案例,逐漸擴(kuò)大覆蓋行業(yè)。
由“量”轉(zhuǎn)“質(zhì)”何解?
客觀來(lái)看,中國(guó)算力發(fā)展依然任重道遠(yuǎn)。
2024中國(guó)算力大會(huì)發(fā)布的《中國(guó)算力發(fā)展報(bào)告(2024年)》顯示,截至去年底,全球智算市場(chǎng)同比增長(zhǎng)130%以上,而中國(guó)智算市場(chǎng)同比增長(zhǎng)超過(guò)60%。
財(cái)聯(lián)社記者注意到,算力建設(shè)熱潮之下,有從業(yè)者在上述大會(huì)上分享了諸多“冷思考”,并將目光聚焦高質(zhì)量算力。
浪潮信息(000977.SZ)聯(lián)合信通院發(fā)布的業(yè)界首個(gè)高質(zhì)量算力評(píng)估體系《人工智能算力高質(zhì)量發(fā)展評(píng)估體系報(bào)告》表示,高質(zhì)量算力是基于最新人工智能理論,采用先進(jìn)人工智能的計(jì)算架構(gòu),與算法、數(shù)據(jù)深度結(jié)合的高水平計(jì)算能力。
財(cái)聯(lián)社記者從浪潮信息方面獲悉,當(dāng)前算力集群實(shí)測(cè)性能和理論性能差距過(guò)大問(wèn)題明顯,部分算力實(shí)際性能不足理論性能的10%。公開(kāi)數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。
張東認(rèn)為,對(duì)于算力的關(guān)注不能僅僅關(guān)注芯片,“很多地方買算力,點(diǎn)名芯片的品牌,構(gòu)建一個(gè)多大規(guī)模的算力中心,實(shí)際上看芯片指標(biāo)沒(méi)有意義,大家還是要從系統(tǒng)角度,綜合考慮最后怎樣滿足應(yīng)用需要。”
郭亮也表示,“目前,我們?cè)谛酒@一層選擇不多。但計(jì)算和網(wǎng)絡(luò)融合方面是一個(gè)熱點(diǎn)。目的是把一臺(tái)AI服務(wù)器,從現(xiàn)在的8卡擴(kuò)展到32卡、512卡,這對(duì)智算集群的能力,包括集群的部署、上線、運(yùn)維都有益處?!?/p>
財(cái)聯(lián)社記者多方采訪獲悉,大規(guī)模智算落地絕非簡(jiǎn)單的規(guī)模數(shù)量堆疊,其復(fù)雜程度呈指數(shù)級(jí)增加,對(duì)智算建設(shè)運(yùn)營(yíng)者的技術(shù)實(shí)力、資源優(yōu)勢(shì)、產(chǎn)業(yè)協(xié)同能力有著很高的要求。
至于智算中心如何由“量”轉(zhuǎn)“質(zhì)”,郭亮稱,“建設(shè)智算中心需要‘適度超前’,結(jié)合當(dāng)?shù)貙?shí)際需求做整體的分析和預(yù)判。”