國內(nèi)首顆量產(chǎn)全功能DPU面市 隨智算中心鋪開有望迎需求放量
原創(chuàng)
2024-06-20 20:52 星期四
科創(chuàng)板日報(bào)記者 郭輝
①中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,產(chǎn)品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進(jìn)行了定制優(yōu)化;
②在算網(wǎng)融合的技術(shù)發(fā)展與應(yīng)用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品重要性凸顯,中科馭數(shù)CEO鄢貴海表示,網(wǎng)中有算這件事情,只有DPU可以干。

《科創(chuàng)板日報(bào)》6月20日訊(記者 郭輝) 國內(nèi)首顆量產(chǎn)全功能DPU算力芯片面市。

昨日(6月19日),中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布。K2-Pro是目前國內(nèi)首顆量產(chǎn)全功能DPU算力芯片,產(chǎn)品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進(jìn)行了定制優(yōu)化。

據(jù)了解,在數(shù)據(jù)處理方面,K2-Pro包處理速率可達(dá)80Mpps,復(fù)雜服務(wù)網(wǎng)格性能從400微秒降至30微秒以內(nèi)。通過PPP、NP內(nèi)核及P4可編程架構(gòu),K2-Pro能夠?qū)崿F(xiàn)業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴(kuò)展;在DPU復(fù)雜場景下,能耗較上一代降低30%。

image

在算網(wǎng)融合的技術(shù)發(fā)展與應(yīng)用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品,重要性凸顯。然而與之伴隨的是,DPU這一產(chǎn)品概念在近幾年發(fā)展中受到不少爭議,比如DPU與智能網(wǎng)卡功能與定位是否重合,英偉達(dá)等廠商對DPU的公開討論越來越少是否意味著被戰(zhàn)略性放棄等。

中科馭數(shù)CEO鄢貴海表示:“網(wǎng)中有算這件事情,只有DPU可以干,這樣的負(fù)載類型不是單純靠CPU能夠處理。”據(jù)介紹,為應(yīng)對行業(yè)趨勢,中科馭數(shù)對DPU的定義跟設(shè)計(jì)也有相應(yīng)變化,不再將DPU視為單一芯片,而是從先進(jìn)芯片架構(gòu)、高兼容性的軟件生態(tài)、低成本部署及業(yè)務(wù)驗(yàn)證等三個(gè)維度重新定義其價(jià)值。

關(guān)于DPU在新的發(fā)展階段的新思考,在發(fā)布會后,中科馭數(shù)CEO鄢貴海、CTO盧文巖、高級副總裁張宇接受了《科創(chuàng)板日報(bào)》在內(nèi)的媒體采訪。

國產(chǎn)DPU概念需要重新被定義

DPU是進(jìn)行算網(wǎng)融合的關(guān)鍵組件”。鄢貴海表示,如今DPU應(yīng)用絕對不僅是卸載部分CPU負(fù)載那么簡單,“有些任務(wù)——比如處理安全上的業(yè)務(wù)、做分布式安全機(jī)制等,不僅GPU干不了,CPU本身也不太能有效處理,而在DPU上做這件事情就會非常簡單”。在中科馭數(shù)看來,DPU功能不僅需要提高算網(wǎng)的計(jì)算集群效率,同時(shí)還要求能夠提高計(jì)算集群運(yùn)維水平、提高集群整體算力規(guī)模。

算網(wǎng)融合是以通信網(wǎng)絡(luò)設(shè)施和計(jì)算設(shè)施的融合發(fā)展為基礎(chǔ),通過計(jì)算、存儲及網(wǎng)絡(luò)資源統(tǒng)一編排管控,滿足業(yè)務(wù)對網(wǎng)絡(luò)和算力靈活泛在、彈性敏捷、智能隨機(jī)應(yīng)用需求的一種新型業(yè)務(wù)模式。

從兩年前東數(shù)西算國家戰(zhàn)略的引入,逐步到去年年底算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)規(guī)劃發(fā)布,到今年各地智算中心全面鋪開,算網(wǎng)一體化模式已深入眾多產(chǎn)業(yè)的技術(shù)迭代和應(yīng)用發(fā)展的大節(jié)奏之中。

其中,DPU也從以前服務(wù)器板卡的產(chǎn)品形態(tài)進(jìn)一步發(fā)展,時(shí)至今日承擔(dān)了越來越重要的算力來源支撐。

鄢貴海表示,DPU需要被重新定義,不能單純只搞芯片這一件事情。DPU本身功能,如果還是與原來狹義理解的DPU負(fù)責(zé)卸載CPU負(fù)載的視角去看待,顯然太過于局限。就像現(xiàn)在看計(jì)算機(jī)系統(tǒng),應(yīng)該要看整體的分布式集群性系統(tǒng)一樣。“現(xiàn)在DPU也要逐步建立起軟件的護(hù)城河,還要做好平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗(yàn)證,讓DPU軟硬件技術(shù)在云里面落地生根?!?/p>

民生證券研究報(bào)告觀點(diǎn)認(rèn)為,得益于智能網(wǎng)卡方案的逐步成熟,疊加全球通用服務(wù)器出貨量的穩(wěn)定增長、L3以上級別智能駕駛汽車的技術(shù)落地、工業(yè)控制領(lǐng)域的需求增加等原因,全球、國內(nèi)DPU產(chǎn)業(yè)均有望實(shí)現(xiàn)快速發(fā)展。

DPU未來應(yīng)用需進(jìn)一步融入高算力節(jié)點(diǎn)

DPU的技術(shù)和功能價(jià)值過去也得到了英偉達(dá)這樣的行業(yè)巨頭認(rèn)可。2020年,英偉達(dá)在GTC戰(zhàn)略發(fā)布中將DPU定義為“第三顆主力芯片”?;贕PU、DPU和CPU三種新一代架構(gòu)構(gòu)建的NVIDIA加速計(jì)算平臺,英偉達(dá)目標(biāo)指向重塑AI時(shí)代的數(shù)據(jù)中心。

據(jù)了解,DPU由基礎(chǔ)網(wǎng)卡進(jìn)化而來,具有獨(dú)立計(jì)算單元是DPU相較于普通網(wǎng)卡的主要特征,可通過ASIC/FPGA/SoC等技術(shù)實(shí)現(xiàn)。從核心功能來看,DPU主要是從CPU上卸載關(guān)鍵網(wǎng)絡(luò)、存儲、安全任務(wù),以降低CPU的運(yùn)算壓力,從而提升整個(gè)數(shù)據(jù)中心的運(yùn)行效率。

然而近兩年DPU的定位和功能也受到一定挑戰(zhàn)。最直觀的感受是,英偉達(dá)如今已經(jīng)很少公開單獨(dú)談?wù)揇PU了,而且國內(nèi)涌現(xiàn)出來的主打DPU產(chǎn)品的廠商,也不如GPU/CPU的項(xiàng)目多。

鄢貴海認(rèn)為,其中的緣由與英偉達(dá)自身的技術(shù)概念營銷及產(chǎn)品方案策略有關(guān),國外芯片巨頭對其DPU產(chǎn)品形態(tài)和定位的調(diào)整依然值得關(guān)注。與此同時(shí),在“大廠弊病”之下,這些巨頭產(chǎn)品迭代節(jié)奏降緩,對于國內(nèi)廠商來說反而是機(jī)會。

“2021年DPU熱度達(dá)到高峰,到2022年行業(yè)形成聚力,再到2023年、2024年迎來產(chǎn)品大規(guī)模應(yīng)用的關(guān)鍵階段,其間英偉達(dá)逐步把原來狹義的DPU剝離了出來,并將DPU概念轉(zhuǎn)移到到NV-Link上,只是不把NV-Link叫DPU,這更多是一種概念的營銷?!?/p>

鄢貴海表示,英偉達(dá)在推產(chǎn)品時(shí),基本是以集群的形式、以完整的高算力節(jié)點(diǎn)來作為產(chǎn)品形態(tài)。在DPU產(chǎn)品方面,英偉達(dá)并沒有加以弱化,DGX里面仍然在部署DPU系統(tǒng)。

端側(cè)加上DPU和已經(jīng)非常完善的CX系列高性能網(wǎng)卡,“可以說全都是英偉達(dá)的王牌,但不會像之前一樣全都亮出來”。鄢貴海認(rèn)為,英偉達(dá)的一體化技術(shù),重型行業(yè)游戲規(guī)則,對國內(nèi)未來做算力或大規(guī)模芯片相關(guān)的廠商來說,是一個(gè)非常好的指向。

除英偉達(dá)外,英特爾與AMD兩家芯片巨頭亦有DPU項(xiàng)目的布局。其中,英特爾基礎(chǔ)設(shè)施處理器(IPU)定位與DPU類似,是一種可編程的網(wǎng)絡(luò)設(shè)備,可以管理存儲流量,減少時(shí)延,同時(shí)通過無磁盤服務(wù)器架構(gòu)有效利用存儲容量,能夠使云和通信服務(wù)提供商減少在CPU方面的開銷,充分釋放性能價(jià)值。AMD則在2022年以19億美元收購Pensando并正式進(jìn)軍DPU領(lǐng)域,Pensando公司CEO和團(tuán)隊(duì)加入AMD的數(shù)據(jù)中心解決方案部門。

“英特爾IPU從定位上來看要更高,直接把基礎(chǔ)設(shè)施作為DPU的定義其實(shí)是極其準(zhǔn)確的。但是英特爾作為行業(yè)內(nèi)的‘大象’,專屬權(quán)力就是慢?!臂迟F海表示,雖然IPU定位很好、基礎(chǔ)也不錯(cuò),但是迭代非常慢,而AMD收購初創(chuàng)公司也有可能直接減慢其DPU項(xiàng)目發(fā)展?!皩︸S數(shù)來說,DPU的定義是集眾家之長,真正還原DPU之于整個(gè)計(jì)算系統(tǒng)的意義?!?/p>

DPU的功能和應(yīng)用范圍都要多過傳統(tǒng)網(wǎng)卡

智算中心的多點(diǎn)全面鋪開也讓智能網(wǎng)卡或以太網(wǎng)物理芯片的需求,成為業(yè)內(nèi)眾多廠商的創(chuàng)新和產(chǎn)業(yè)化競爭的焦點(diǎn)。目前浪潮、新華三、博通等廠商均有相關(guān)布局。

DPU的產(chǎn)品概念和技術(shù)特點(diǎn),也被直接拿來與智能網(wǎng)卡進(jìn)行對比。究竟孰優(yōu)孰劣、是否會被取代,受到業(yè)內(nèi)的關(guān)注和討論。

面對爭議,鄢貴海接受采訪時(shí)認(rèn)為,DPU不會被取代,其獨(dú)特優(yōu)勢反而會在未來的智算中心建設(shè)中迎來需求放量。

“所謂的智算中心網(wǎng)卡,其功能來說在智算中心中要解決的核心問題是GPU之間、GPU跟存儲之間的通信,但在解決GPU跟CPU路徑中的帶寬和數(shù)據(jù)流量的問題時(shí)沒有那么顯著。”鄢貴海表示,網(wǎng)卡主要解決網(wǎng)絡(luò)數(shù)據(jù)進(jìn)入后通過PCIe設(shè)備接入主機(jī)的過程,并不會對高帶寬的要求進(jìn)行特殊處理,這種情況下傳統(tǒng)網(wǎng)卡不太適用于未來智算中心的網(wǎng)絡(luò)接口卡位置。

在鄢貴??磥恚珼PU要支持類似于GBR、GBS的負(fù)載,其實(shí)就是給GPU之間、GPU和CPU之間的通信找到一條快速通路,這一通路要搭建在全新的網(wǎng)絡(luò)設(shè)備接口上,而全新的網(wǎng)絡(luò)接口就是DPU。因此,DPU的功能和應(yīng)用范圍都要多過傳統(tǒng)網(wǎng)卡,“未來智算中心里面DPU用的量不僅不會少,還會越來越多?!?/p>

“當(dāng)然,數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,通常網(wǎng)絡(luò)不可能只有一套”。鄢貴海也表示,未來不同網(wǎng)絡(luò)可能要用不同的功能,比如運(yùn)維、管控、監(jiān)控用傳統(tǒng)以太做,智算靠無損RDMA的網(wǎng)絡(luò)?!斑@種情況下,在智算中心中有用傳統(tǒng)網(wǎng)卡的需求,但是更大的需求、增長更快的需求,還是在高速網(wǎng)絡(luò)、高速的RDMA及無損網(wǎng)絡(luò)上?!?/p>

收藏
77.03W
我要評論
歡迎您發(fā)表有價(jià)值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
8.49W 人關(guān)注
1.08W 人關(guān)注
9354 人關(guān)注