OpenAI 周一 (13 日) 在線上發表會上推出新型人工智慧 (AI) 模型「GPT-4o」,該模型能進行語言、文本和視覺推理,而且在文本、影片和音頻方面的能力都有所提高,所有用戶將能免費使用。此外,該公司還推出桌上型電腦版本 ChatGP 和新的用戶介面,為擴大其廣受歡迎的聊天機器人做足準備。
OpenAI 科技長穆拉提 (Mira Murati) 在當天的直播活動中表示,此次更新將把 GPT-4o 帶給所有人,包括免費用戶,不過 GPT-4o 的付費用戶受的容量限制會比企業付費用戶更多。
值得一提的是,穆拉提在發表會尾聲還感謝輝達 (NVDA.US) 執行長黃仁勳及其公司替 OpenAI 的技術提供必要的圖形處理器 (GPU)。她說:「我只想感謝令人難以置信的 OpenAI 團隊,也感謝黃仁勳(Jensen Huang) 和輝達團隊為我們帶來最先進的 GPU,讓今天發表會的功能展示成真。」
新模型「GPT-4o」的特點方面,穆拉提表示其速度比 GPT-4 Turbo 快一倍,而且成本還只有後者的一半,在文本、影片和聲音方面的能力都有所提升,她稱這是該公司首次在使用方便方面邁出一大步。
穆拉提還說 GPT-4o 提高 ChatGPT 的品質以及 50 種不同語言的速度,新模型將透過 OpenAI 的 API 提供,如此一來軟體開發商就能使用新模型建構應用程式。
值得注意的是,OpenAI 研究員 Mark Chen 展示新模型的音頻功能,展現其感知使用者情緒功能,透過播放音樂舒緩情緒,而且還能處理被使用者突然打斷的狀況,甚至還能透過分析用戶臉部表評估當下情緒反應。
有趣的是,新模型能講睡前床邊故事,可以要求改變語調,使其更戲劇化或更機械式,或是以歌唱方式說故事。
不只如此,該模型的翻譯功能進一步延伸至聽聲翻譯。展示過程中,Mark Chen 與穆拉提分別講義大利文和英文,隨後新模型把雙方交談的內容翻譯成各自的語言。
另外,OpenAI 團隊成員也展示新模型解決數學方程式和輔助編寫程式碼的能力,並將其定位微軟 (MSFT.US) 自家 GitHub Copilot 的有力競爭對手。對於 OpenAI 來說,這是該公司自去年 8 月推出 ChatGPT Enterprise 以來向前邁出的最大一步。
微軟 (MSFT.US) 投資的 OpenAI,估值已超過 800 億美元,但這家成立於 2015 年的公司面臨著壓力,一方面要保持在生成式 AI 市場的領先地位,另一方面要想辦法賺錢,因為其在處理器和基礎設施投入大量資金構建和訓練其模型。
包含 OpenAI,微軟和 Google(GOOGL.US) 正引領著一場生成式 AI 淘金熱,似乎每個行業的公司都在競相將 AI 聊天機器人添加到關鍵服務中,以避免落後於競爭對手。本月早些時候,OpenAI 的競爭對手 Anthropic 宣布其首個企業產品和免費的 iPhone 應用程式。
PitchBook 的數據顯示,2023 年,近 700 筆生成式 AI 交易的投資額達到創紀錄的 291 億美元,比前一年成長 260% 以上,預估該市場的收入將在十年內突破 1 兆美元。
不過一些業內人士對未經測試的新服務進入市場的速度表示擔憂,學者和倫理學家對這項技術傳播偏見的傾向感到憂慮。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網