新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
智譜(02513.HK)落地ZCube組網架構 相同規模和配置硬件投入下算力多出15%
智譜(02513.HK)公布,針對PD分離部署中日益嚴峻的結構性網絡擁塞難題,智譜、馭馴網絡與清華大學開展聯合攻關,提出並在線上生產環境落地ZCube組網架構。在GLM-5.1 coding生產環境的...
重設
送出
視窗將於5秒內關閉
智譜(02513.HK)落地ZCube組網架構 相同規模和配置硬件投入下算力多出15%
關閉
AASTOCKS新聞
推薦
7
利好
6
利淡
4
 
 

智譜(02513.HK)  0.000 (0.000%)    沽空 $7.42千萬; 比率 9.772%   公布,針對PD分離部署中日益嚴峻的結構性網絡擁塞難題,智譜、馭馴網絡與清華大學開展聯合攻關,提出並在線上生產環境落地ZCube組網架構。

在GLM-5.1 coding生產環境的基準測試中,ZCube實現純粹靠架構調優帶來的跨越,包括GPU、軟件棧及應用保持不變,交換機與光模塊資本支出減少33%;GPU平均推理吞吐提升15%;TTFT P99降低40.6%。

相關內容《大行》摩通:DeepSeek V4具第一方成本優勢 智譜(02513.HK)MiniMax(00100.HK)須加強市場定位迎戰
總結來說,對相同規模和配置的GPU及服務器硬件,在不修改任何應用的前提下,組網架構升級為ZCube之後,不但節省三分一的光模塊和交換機硬件,而且集群每秒能多服務15%的推理請求。這在當前推理業務暴增、算力資源緊缺的背景下,顯得非常具有實用價值。當前,該ZCube集群已穩定運行兩周多,在GLM-5.1 coding推理服務中發揮著重要作用。(jl/da)(港股報價延遲最少十五分鐘。沽空資料截至 2026-05-21 16:25。)

AASTOCKS新聞

AASTOCKS.com LIMITED 版權所有,不得轉載