智譜發佈GLM-5.1高速版API，刷新全球大模型API速度紀錄

關閉

格隆匯新聞

推薦

利好

利淡

沽空

股價

AASTOCKS旗下aacat開證券戶口送1股Intel/指定黃金ETF!

5月22日｜智譜近日推出GLM-5.1高速版API“GLM-5.1-highspeed”，其模型輸出速度達到400 tokens/s，刷新了當前全球大模型廠商API的速度上限。

長期以來，高速模型幾乎總是輕量級模型，但GLM-5.1高速版打破了這一行業慣例。它首次在國產大模型中，將旗艦級能力與極致低延遲同時帶入生產環境，用户無需再為響應速度犧牲模型質量。

實測顯示，在AI編程場景中，寫代碼彷彿開啟了10倍速，模型能夠一邊理解工程上下文，一邊持續生成代碼與修改方案；在3D遊戲中，玩家控制一個角色在3D地圖裏移動並輸入文字，模型會根據輸入的文字瞬時建模，場景實時改變，此前因延遲而無法實現的全新產品形態，開始真正具備落地可能；在交互界面上，在用户提出需求的那一刻，模型可以即時生成恰好匹配該需求的工具與交互，甚至可以做出意圖判斷。

實現這一速度的核心是TileRT高性能推理引擎。該引擎由智譜GLM團隊與TileRT團隊聯合打造，在推理引擎、調度系統與底層基礎設施三個層面進行了系統級優化。其設計思路是徹底拋棄Runtime層的動態調度，在編譯期（AOT）將整個計算圖靜態編排為一個常駐GPU的persistent Engine Kernel。

目前，GLM-5.1高速版適用於AI編程、實時交互、商業決策、實時語音等速度敏感場景，並通過智譜MaaS平台向部分企業客户開放。

新聞來源 (不包括新聞圖片): 格隆匯

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

免責聲明