Google 於 5 月 19 日至 20 日,在美國加州山景城舉辦了年度開發者大會 (I/O 2026),執行長 Sundar Pichai 在會中正式宣布,「我們已進入代理式 Gemini(Agentic Gemini)」時代,並將 AI 代理全面整合進搜尋、瀏覽器、手機、工作軟體甚至是智慧眼鏡中。
他強調,這場盛會象徵著一個重大的系統性轉向:AI 不再僅僅是「回答問題」的聊天機器人,而是進化為能「採取行動」的 AI 代理 (AI Agents)。
過去一年是 Google AI 技術飛速發展的一年。Pichai 指出,Gemini App 的月活躍用戶已突破 9 億,每日請求量增長了 7 倍。目前,Google 模型 API 每分鐘處理約 190 億個 Token,每月處理量更達到驚人的 3.2 千兆 (quadrillion) 個,同比增長 7 倍。
為了支撐如此龐大的算力需求,Google 宣布今年的資本支出將高達 1800 億至 1900 億美元。此外,Google 推出了第八代 TPU (TPU 8),包含針對大規模預訓練優化的 TPU 8t,以及專為推理設計、顯著降低延遲的 TPU 8i。
大會首日發布了 Gemini 3.5 Flash,這是 Gemini 3.5 系列的首款模型。它在編碼與代理任務上表現優異,且生成輸出 Token 的速度比其他前沿模型快約 4 倍,成本卻不到同級模型的一半。更強大的 Gemini 3.5 Pro 則預計於下個月推出。
另一亮點是影片生成模型 Gemini Omni。這是一款具備物理規律理解 (如重力、流體力學) 的「世界模型」,能實現多模態的互動與編輯。使用者可以透過自然語言對產出的影片進行對話式編輯,例如修改角色背景或場景,重新定義了視覺內容的創作方式。
Google 正積極實踐「代理式企業 (Agentic Enterprise)」的願景。大會推出了 Gemini Spark,這是一款 24/7 全天候運行的個人 AI 代理。由於它運行在 Google Cloud 虛擬機器上,即便用戶合上筆記型電腦,它也能在背景持續執行任務,如自動寄信、追蹤活動細節、或跨應用程式協調工作流。
針對開發者,Google 升級了 Antigravity 2.0 平台。這是一個獨立的桌面應用程式,專為「代理優先」的開發而設計,能引導並協調多個自主代理執行複雜的工程任務。
Google 搜尋迎來了 25 年來最大的升級。全新的資訊代理 (Information Agents) 能在背景全天候監控特定主題,並在發現新資訊時主動更新結果。此外,Google 推出了 AI Mode,讓搜尋框支援多模態輸入,並能動態生成可互動的 UI 面面 (如周末旅行計畫表)。
購物體驗也因 Universal Cart(通用購物車) 而改變。這款 AI 代理驅動的購物車能跨平台追蹤優惠、價格歷史,並會主動提醒產品間的相容性問題 (例如組裝電腦時零件是否匹配)。
在 Google Workspace 方面,Docs Live 實現了語音導向的文檔編輯,讓使用者能透過「腦力激盪」式的口述直接生成結構化文件。新工具 Google Pics 則讓使用者能精確掌控圖像中的單一物件進行編輯。
硬體方面,Google 預告了與 Gentle Monster 和三星等夥伴合作的 Android XR 智慧眼鏡。這款智慧眼鏡分為語音型與顯示型,能透過 Gemini 提供實時導航、翻譯,甚至能直接幫用戶下單咖啡,過程中手機完全無需拿出口袋。
隨着生成式 AI 的普及,Google 擴展了其浮水印技術 SynthID,現已獲得 OpenAI 等多家企業採用,並整合進搜尋與 Chrome 中以識別 AI 生成內容。此外,AI 安全代理 CodeMender 能自主識別並修復程式碼中的漏洞,確保代理式企業的安全運作。