新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
智譜(02513.HK)落地ZCube組網架構 相同規模和配置硬件投入下算力多出15%
智譜(02513.HK)公布,針對PD分離部署中日益嚴峻的結構性網絡擁塞難題,智譜、馭馴網絡與清華大學開展聯合攻關,提出並在線上生產環境落地ZCube組網架構。在GLM-5.1 coding生產環境的...
重設
送出
視窗將於5秒內關閉
智譜(02513.HK)落地ZCube組網架構 相同規模和配置硬件投入下算力多出15%
關閉
AASTOCKS新聞
推薦
8
利好
9
利淡
5
 
 

智譜(02513.HK)  -36.000 (-2.462%)    沽空 $4.60千萬; 比率 5.364%   公布,針對PD分離部署中日益嚴峻的結構性網絡擁塞難題,智譜、馭馴網絡與清華大學開展聯合攻關,提出並在線上生產環境落地ZCube組網架構。

在GLM-5.1 coding生產環境的基準測試中,ZCube實現純粹靠架構調優帶來的跨越,包括GPU、軟件棧及應用保持不變,交換機與光模塊資本支出減少33%;GPU平均推理吞吐提升15%;TTFT P99降低40.6%。

總結來說,對相同規模和配置的GPU及服務器硬件,在不修改任何應用的前提下,組網架構升級為ZCube之後,不但節省三分一的光模塊和交換機硬件,而且集群每秒能多服務15%的推理請求。這在當前推理業務暴增、算力資源緊缺的背景下,顯得非常具有實用價值。當前,該ZCube集群已穩定運行兩周多,在GLM-5.1 coding推理服務中發揮著重要作用。(jl/da)(港股報價延遲最少十五分鐘。沽空資料截至 2026-06-04 16:25。)

AASTOCKS新聞

AASTOCKS.com LIMITED 版權所有,不得轉載