美股
基金
外匯、加密貨幣
滬、深港通
港股
 
納斯達克
 
恆生指數
 
道瓊斯
 
標準普爾
 
 
新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
挑戰輝達霸權 Cerebras憑什麼成AI晶片最強黑馬?
AI 推理晶片新創 Cerebras Systems 於 5 月 14 日正式登陸納斯達克,IPO 估值達 488 億美元,較 8 個月前約 81 億美元估值暴增逾 6 倍,並傳出超額認購超過 20 ...
重設
送出
視窗將於5秒內關閉
挑戰輝達霸權 Cerebras憑什麼成AI晶片最強黑馬?
鉅亨網新聞
推薦
1
利好
1
利淡
0
 
 

AI 推理晶片新創 Cerebras Systems 於 5 月 14 日正式登陸納斯達克,IPO 估值達 488 億美元,較 8 個月前約 81 億美元估值暴增逾 6 倍,並傳出超額認購超過 20 倍,成為今年全球估值規模最大的 IPO 之一。

市場之所以對 Cerebras 抱持高度期待,核心原因在於 AI 產業正快速從「訓練時代」邁向「推理時代」,而傳統 GPU 架構在推理場景中的效率瓶頸逐漸浮現。

輝達 (NVDA.US)      執行長黃仁勳今年於 GTC 2026 大會上坦言,「AI 推理拐點已至」。根據德勤統計,2023 年企業 AI 算力支出仍以訓練為主,占比約 60%,推理僅 40%;但兩年後,推理占比預計將提高至 85%。

創投機構 Andreessen Horowitz(a16z) 研究指出,2025 年推理模型消耗的 token 占比,已從過去接近零快速攀升至整體 AI 算力需求的一半以上,顯示 AI 模型升級正持續放大推理算力需求。

不過,GPU 在推理任務上存在結構性限制。大型語言模型 (LLM) 推理主要分為 Prefill(預填充)與 Decode(解碼)兩階段。GPU 擅長前者的大規模平行運算,但 Decode 屬於序列式生成,每個 token 皆需等待前一個 token 完成,同時反覆讀取模型權重與 KV Cache 資料,造成龐大的資料搬運負擔。

以 700 億參數模型為例,其模型權重約達 140GB,加上持續增長的 KV Cache,GPU 運算過程往往受限於記憶體頻寬,而非純粹算力。業界將此問題稱為「記憶體牆 (Memory Wall)」。

數據顯示,AI 算力每兩年約提升 3 倍,但 HBM 記憶體頻寬僅增加 1.6 倍。若拉長至 10 年觀察,算力增幅高達 1000 倍,頻寬卻僅提升 10 倍,導致 GPU 大量時間消耗於資料搬運而非實際運算。

HuggingFace 分析甚至指出,輝達 B200 GPU 在 batch 等於 1 的推理場景下,Tensor Core 閒置率超過 99%。

即便如此,推理仍是輝達最核心收入來源。黃仁勳曾公開表示,輝達資料中心業務約 65% 收入來自推理應用。市場認為,這也解釋了為何輝達近期積極布局低延遲推理架構,甚至傳出斥資約 200 億美元收購 Groq 相關技術。

在此背景下,Cerebras 以「晶圓級運算」架構切入市場,試圖顛覆傳統 GPU 設計。

其核心產品 WSE-3(Wafer Scale Engine 3) 直接將整片 300mm 矽晶圓做成單一處理器,而非傳統切割成多顆 GPU。WSE-3 內建 90 萬個 AI 核心、44GB 片上 SRAM,官方宣稱頻寬達 21PB/s,相較輝達 B200 約 8TB/s 頻寬高出 2625 倍。

這種設計使資料交換無須跨晶片傳輸,大幅降低延遲。根據官方測試,在 Llama 3.3 70B 模型推理中,Cerebras 每秒 token 輸出達 2140,相較最佳 GPU 方案約 120,高出近 18 倍;即使在 Llama 4 Maverick 400B 模型上,也達 2500 對 1000,性能超過 2 倍。

不過,晶圓級架構長年被視為「幾乎不可能實現」的技術方向,主要卡在三大工程難題。

首先是光刻限制。傳統光刻單次曝光最大尺寸約 26mm×33mm,遠小於整片晶圓。Cerebras 與台積電 (TSM.US)      合作開發「劃線橋接」技術,透過延伸金屬沉積路徑,讓整片晶圓形成統一運算網路。

其次是超大晶片良率問題。Cerebras 將單一 AI 核心面積縮小至 0.05 平方毫米,約僅為 H100 SM 核心面積的 1%,即使局部缺陷,也僅影響極小區域,並透過 1% 至 1.5% 備援核心提高容錯能力。

第三則是供電與散熱。WSE-3 功耗高達 23kW,需要超過 2 萬安培電流。Cerebras 採用上方垂直供電與底部水冷散熱設計,將整片晶圓溫差控制在 20℃內。

在技術想像空間與 AI 推理熱潮推升下,Cerebras 估值一路飆升。根據 S-1 文件,公司估值從 81 億美元升至 230 億美元,最終 IPO 估值達 488 億美元。

此外,OpenAI 也與 Cerebras 簽署超過百億美元的多年合作協議,而亞馬遜 (AMZN.US)      旗下 AWS 亦選擇導入 Cerebras 作為 Bedrock 推理加速層之一。

然而,高估值背後也伴隨明顯風險。

根據 S-1 文件,Cerebras IPO 估值約相當於 2025 年預估營收 5.1 億美元的 95 倍本益比,而輝達目前約為 25 倍,意味市場給予 Cerebras 近 4 倍於輝達的估值溢價。

但獲利能力方面,Cerebras 仍遠落後於輝達。輝達毛利率約 75% 至 80%,Cerebras 僅 39%。公司 2025 年 GAAP 淨利約 2.378 億美元,但其中包含 3.63 億美元非現金會計收益;若以 Non-GAAP 計算,實際仍虧損 7570 萬美元。

此外,公司營收高度集中。2025 年約 86% 收入來自阿聯酋兩家機構,其中 MBZUAI 占 62%,G42 占 24%,而美國市場收入反而年減 34%。

OpenAI 雖簽下百億美元合作,但其角色同時也是客戶、債權人、潛在股東與早期投資者。文件顯示,246 億美元訂單積壓中,僅 15% 將於 2026 至 2027 年認列,其餘 43% 須等到 2028 至 2029 年。若 Cerebras 無法如期交付產能,OpenAI 有權終止合約並要求償還貸款。

更重要的是,OpenAI 並未將所有推理布局押注於 Cerebras。去年 10 月,OpenAI 也與超微 (AMD.US)      簽署 6GW 部署協議。AWS 雖與 Cerebras 合作,但主要推理架構仍以自研 Trainium 3 為核心。

市場人士指出,目前各大科技公司普遍採取多路線並行策略,尚無任何一家將 Cerebras 視為唯一主力方案。

此外,業界也質疑其測試數據可能受「推測解碼」技術加持。該技術由小模型預測 token、大模型驗證,可額外提升約 3 倍速度,代表純硬體優勢未必如數據顯示般巨大。

更大的限制則來自 44GB 片上記憶體容量。隨著 AI Agent 與長上下文應用快速發展,未來模型對記憶體需求將遠超 44GB。分析指出,Cerebras 在短上下文場景下速度驚人,但一旦超出片上記憶體範圍,性能與成本優勢便會快速下降。

整體而言,市場目前對 Cerebras 的期待,更多來自「稀缺 AI 基礎設施」的資本敘事,而非已被完全驗證的商業模式。

未來 Cerebras 能否真正挑戰輝達地位,關鍵仍在於兩點:OpenAI 等大型合約能否順利落地,以及晶圓級架構能否突破記憶體與應用場景限制。

若無法持續擴大商業化應用,這場 AI 推理革命背後的高估值敘事,也可能面臨泡沫化風險。

(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)
新聞來源 (不包括新聞圖片): 鉅亨網
相關股份
0/0
 
美股網站地圖
支援電郵: support@aastocks.com
阿斯達克網絡信息有限公司 (AASTOCKS.COM LIMITED) 版權所有,不得轉載
免責聲明
閣下明確同意使用本網站/應用程式的風險是由閣下個人承擔。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力確保所提供資訊的準確和可靠度,但不能保證其絕對準確和可靠,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任(不管是否侵權法下的責任或合約責任又或其他責任)。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均對資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商不會就任何原因導致的中斷、不準確、錯誤或遺漏或因此而造成的任何損害賠償(不論直接或間接、相應而生、懲罰性或懲戒性)對任何人承擔責任。

AASTOCKS.com Ltd不負責,亦不承擔任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導致的損失或損害,如颱風、暴雨、其他自然災難、政府或有關機構的限制、騷動、戰爭、病毒爆發,網絡故障或電信故障,引致AASTOCKS.com Ltd不能履行協議內的責任或提供服務。

Morningstar 免責聲明:版權所有©2020 Morningstar,Inc。保留所有權利此處包含的資料,數據,分析和意見(“信息”):(1)包含Morningstar及其內容提供者的專營資料; (2)除特別授權外,不得複製或轉載; (3) 不構成投資建議; (4)僅供參考,(5)並未為所載資料的完整性、準確性及時間性作出保證。Morningstar對於閣下使用任何相關資料而作出的任何有關交易決定、傷害及其它損失均不承擔任何責任。 請在使用所有資料前作出核實,並且在諮詢專業投資顧問意見前勿作任何投資決定。 過往業績並不代表將來表現,任何投資項目的價值及所得收入皆可升可跌。

本網站/應用程式包含的內容和信息乃根據公開資料分析和演釋,該公開資料,乃從相信屬可靠之來源搜集,這些分析和信息並未經獨立核實和AASTOCKS.com Limited並不保證他們的準確性、完整性、實時性或者正確性。

在本網站/應用程式的資料、金融市場數據、報價、圖表、統計數據、匯率、新聞、研究、分析、購買或者出售評分、財金教學及其他資訊僅作參考使用,在根據資訊執行證券或任何交易前,應諮詢獨立專業意見,以核實定價資料或獲取更詳細的市場信息。AASTOCKS.com Limited不應被視為游說任何訂戶或訪客執行任何交易,閣下須為所有跟隨在本網站/應用程式的資料、評論和購買或出售評分執行的交易負責。

為了方便使用者,阿斯達克網絡信息有限公司增加了由 Azure OpenAI開發的翻譯功能,以幫助使用者理解阿斯達克網絡信息有限公司平台上的資訊中文以外的語言。 翻譯後的文字可能會失去一些原本的意義。資訊的某些項目(包括包含文字的圖像、帶字幕的影片、PDF 文件或地圖)可能無法翻譯,某些功能可能無法在翻譯版本中使用。

阿斯達克網絡信息有限公司不保證翻譯的準確性及完整性,並且翻譯後的文本不應被認為是準確的及完整的。 對於因使用翻譯功能而造成的任何形式的損害或損失,阿斯達克網絡信息有限公司不承擔任何責任。

AASTOCKS.com Limited之信息服務基於「現況」及「現有」的基礎提供,網站/應用程式的信息和內容如有更改恕不另行通知。AASTOCKS.com Limited有權但無此義務,改善或更正在本網站/應用程式的任何部分之錯誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下,不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內容或者利用在本網站/應用程式的信息和內容作商業用途。

投資涉及風險。 閣下可自行决定利用本網站的財金教學作學術參考用途,但 AASTOCKS.com Limited不能並不會保證任何在本網站/應用程式現在或未來的購買或出售評論和訊息會否帶來贏利。過往之表現不一定反映未來之表現,AASTOCKS.com Limited不可能作出該保證及用戶不應該作出該假設。

AASTOCKS.com Limited也許連結訂戶或訪客至其有興趣的網站,但AASTOCKS.com Limited只提供此服務給訂戶或訪客並不為此安排負責。

AASTOCKS.com Limited對於任何包含於、經由、連結、下載或從任何與本網站/應用程式有關服務所獲得之資訊、內容或廣告,不聲明或保證其內容之正確性或可靠性。 對於閣下透過本網站/應用程式上之廣告、資訊或要約而展示、購買或取得之任何產品、資訊資料,本公司亦不負品質保證之責任。

AATV是AASTOCKS.com Limited旗下的視頻網站平台。

閣下確認:(i) AATV只為提供資訊,並不為了任何交易目的;(ii) AATV節目內容以及其提供的資料並不構成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦,或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務;及(iii)AATV並非為任何人士或法律實體在其他司法管轄區或國家使用,而在當地可能因該使用或分發而違反當地法律或法規。

AATV中節目內容中的個人意見和觀點僅供參考及討論,亦並不代表AASTOCKS.com Limited的立場。投資者必須按其本身投資目標及財務狀況自行作出投資決定。AASTOCKS.com Limited不對以下任何情況對閣下或任何人直接或間接負責:(i)AATV的不准確性,錯誤或遺漏,包括但不限於報價和財務數據; (ii)AATV中節目傳輸的延遲,錯誤或中斷; (iii)閣下由AATV中節目內容招致任何損失。

我們保留權利不時更改本免責聲明並於本網站/應用程式刊登更新版本。閣下必須定期查閱於本網站/應用程式刊登的資訊,以確保您即時知悉任何有關的改動。 如閣下於本免責聲明更新後仍繼續使用本網站/應用程式,即代表閣下同意接受更改後的本免責聲明的約束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免責聲明的中英原文如有任何岐異,一切以英文原文為準。

更新日期為: 2026年2月9日