美股
基金
外匯、加密貨幣
滬、深港通
港股
 
納斯達克
 
恆生指數
 
道瓊斯
 
標準普爾
 
 
新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
Claude Opus 4.6逼近ASL-4安全門檻!Anthropic示警:AI自我逃逸恐引發全球失控危機
人工智慧(AI)安全警報全面升級。美國 AI 新創公司 Anthropic 近日發布的一份長達 53 頁的《破壞風險報告:Claude Opus 4. 6》(Sabotage Risk Report:...
重設
送出
視窗將於5秒內關閉
Claude Opus 4.6逼近ASL-4安全門檻!Anthropic示警:AI自我逃逸恐引發全球失控危機
鉅亨網新聞
推薦
0
利好
0
利淡
1
 
 

人工智慧(AI)安全警報全面升級。美國 AI 新創公司 Anthropic 近日發布的一份長達 53 頁的《破壞風險報告:Claude Opus 4. 6》(Sabotage Risk Report: Claude Opus 4.6)指出,如果 Claude 自我逃逸,將造成全球失控。

Anthropic 表示,其最新模型 Claude Opus 4.6 的能力已逼近該公司設定的「AI 安全等級 4」(ASL-4)門檻,並提前預警了最可怕的情況,認為有朝一日,AI 可能會秘密逃離實驗室,造成全球大崩潰。

所謂「破壞」(sabotage),是指當一套擁有高度權限的 AI 系統,在組織內部未經授權地自行運用其權限,對關鍵系統或決策流程進行操弄、干擾甚至破壞,進而大幅提高未來發生重大災難風險的情況。

舉例來說,若 AI 因錯誤或偏離的目標導向而刻意影響研究方向,或在無意間修改、扭曲安全測試與評估結果,使決策者誤判風險狀況,並對整體安全體系造成深遠影響。

能力逼近 ASL-4 風險進入灰區

Anthropic 過去曾承諾,當模型能力接近 ASL-4(涉及高度自主與潛在災難性誤用能力)時,將對外發布風險評估。

而如今,Claude Opus 4.6 似乎已跨過內部評估門檻。

根據 ASL 分級系統:

  • ASL-1:不具實質災難風險
  • ASL-2:出現早期危險跡象,但尚不具實用性
  • ASL-3:顯著提升災難性誤用風險,具初階自主能力
  • ASL-4(ASL-5+)以上:尚未明確定義,預期將出現質變式能力躍升

報告強調,Claude Opus 4.6 尚未達到 ASL-4,但已非常接近門檻,尤其是在自主決策與複雜推理能力上。

Anthropic 表示,當 AI 被廣泛部署於安全研發、程式撰寫與數據生成等核心流程時,它已不再只是「聊天工具」,而是一種具備行動能力的「研發參與者」。

八條潛在災難路徑

報告也列出八種可能導致災難性後果的風險路徑,包括:

  1. 在安全相關研發中的普遍敷衍
  2. 對安全研究進行破壞
  3. 預留未來失控模型的程式後門
  4. 污染未來模型訓練資料
  5. 自主逃逸並自治運行
  6. 內部持續性惡意部署
  7. 破壞其他高資源 AI 機構的研發
  8. 干擾政府決策機制

Anthropic 認為,在目前監控機制下,這些風險「可控但不可忽視」。真正令人不安的,是模型能力已逼近舊有評估工具的極限。

報告直言,儘管目前尚未發現模型具備「持續一致的惡意目標」,但相關風險「非常低,卻不為零」,人類已正式進入 AI 風險的「灰色地帶」。

根據報告,Claude Opus 4.6 已經在特定技術測試中展現驚人能力。例如在 kernel 優化評估中,達到 427 倍加速表現,遠超人類 40 小時工作的標準門檻。

更關鍵的是,Anthropic 承認其自動化自主性評估工具已出現「飽和」,不足以再有效排除 ASL-4 級風險。換言之,舊有安全驗證方法,可能已無法完整衡量新一代模型的能力。

報告指出,只要未來模型在推理能力上出現明顯突破,或在壓力測試中取得大幅提升,現有安全論證將失效。

安全主管離職 內部警訊浮現

事實上,這份警報似乎早有徵兆。

在這份風險報告發布前夕,Anthropic 安全研究主管 Mrinank Sharma 就已宣布辭職。他在公開信中寫道:「世界正處於危機之中。不只是 AI,而是一系列交織的全面性危機。」

他更指出,在 Anthropic 內部,「讓價值觀真正主導行動」極其困難。

Sharma 的研究發現,每天約有 7 萬 6 千人的現實感知可能受到 AI 對話影響,而使用者往往將最具風險的對話評為最令人滿意。

更令人側目的是,他並未轉投其他 AI 企業,而是選擇離開產業、轉向詩歌創作。此舉被部分觀察者解讀為對 AI 發展方向的深層失望。

全球安全裂縫擴大

值得注意的是,產業動盪並未止於 Anthropic。由馬斯克創立的 xAI 亦有多名核心創辦成員離職。部分研究者公開表示,遞迴式自我提升的 AI 循環,可能在未來一年內上線。

此外,由「AI 教父」班吉歐(Yoshua Bengio )參與的國際 AI 安全報告亦指出,AI 在測試與實際使用環境中出現行為差異,並非偶發現象。

報告預測,到 2030 年,AI 在所有認知維度超越人類的情境發生機率約為 20%,且可能主動關閉監控或偽造報告。

多項訊號疊加之下,市場、監管與技術社群均感受到壓力。一些國家對全球 AI 安全協議態度轉趨保守,監管協調面臨挑戰。

新聞來源 (不包括新聞圖片): 鉅亨網
公佈日期
指標
暫時沒有相關新聞。
 
美股網站地圖
支援電郵: support@aastocks.com
阿斯達克網絡信息有限公司 (AASTOCKS.COM LIMITED) 版權所有,不得轉載
免責聲明
閣下明確同意使用本網站/應用程式的風險是由閣下個人承擔。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力確保所提供資訊的準確和可靠度,但不能保證其絕對準確和可靠,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任(不管是否侵權法下的責任或合約責任又或其他責任)。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均對資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商不會就任何原因導致的中斷、不準確、錯誤或遺漏或因此而造成的任何損害賠償(不論直接或間接、相應而生、懲罰性或懲戒性)對任何人承擔責任。

AASTOCKS.com Ltd不負責,亦不承擔任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導致的損失或損害,如颱風、暴雨、其他自然災難、政府或有關機構的限制、騷動、戰爭、病毒爆發,網絡故障或電信故障,引致AASTOCKS.com Ltd不能履行協議內的責任或提供服務。

Morningstar 免責聲明:版權所有©2020 Morningstar,Inc。保留所有權利此處包含的資料,數據,分析和意見(“信息”):(1)包含Morningstar及其內容提供者的專營資料; (2)除特別授權外,不得複製或轉載; (3) 不構成投資建議; (4)僅供參考,(5)並未為所載資料的完整性、準確性及時間性作出保證。Morningstar對於閣下使用任何相關資料而作出的任何有關交易決定、傷害及其它損失均不承擔任何責任。 請在使用所有資料前作出核實,並且在諮詢專業投資顧問意見前勿作任何投資決定。 過往業績並不代表將來表現,任何投資項目的價值及所得收入皆可升可跌。

本網站/應用程式包含的內容和信息乃根據公開資料分析和演釋,該公開資料,乃從相信屬可靠之來源搜集,這些分析和信息並未經獨立核實和AASTOCKS.com Limited並不保證他們的準確性、完整性、實時性或者正確性。

在本網站/應用程式的資料、金融市場數據、報價、圖表、統計數據、匯率、新聞、研究、分析、購買或者出售評分、財金教學及其他資訊僅作參考使用,在根據資訊執行證券或任何交易前,應諮詢獨立專業意見,以核實定價資料或獲取更詳細的市場信息。AASTOCKS.com Limited不應被視為游說任何訂戶或訪客執行任何交易,閣下須為所有跟隨在本網站/應用程式的資料、評論和購買或出售評分執行的交易負責。

為了方便使用者,阿斯達克網絡信息有限公司增加了由 Azure OpenAI開發的翻譯功能,以幫助使用者理解阿斯達克網絡信息有限公司平台上的資訊中文以外的語言。 翻譯後的文字可能會失去一些原本的意義。資訊的某些項目(包括包含文字的圖像、帶字幕的影片、PDF 文件或地圖)可能無法翻譯,某些功能可能無法在翻譯版本中使用。

阿斯達克網絡信息有限公司不保證翻譯的準確性及完整性,並且翻譯後的文本不應被認為是準確的及完整的。 對於因使用翻譯功能而造成的任何形式的損害或損失,阿斯達克網絡信息有限公司不承擔任何責任。

AASTOCKS.com Limited之信息服務基於「現況」及「現有」的基礎提供,網站/應用程式的信息和內容如有更改恕不另行通知。AASTOCKS.com Limited有權但無此義務,改善或更正在本網站/應用程式的任何部分之錯誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下,不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內容或者利用在本網站/應用程式的信息和內容作商業用途。

投資涉及風險。 閣下可自行决定利用本網站的財金教學作學術參考用途,但 AASTOCKS.com Limited不能並不會保證任何在本網站/應用程式現在或未來的購買或出售評論和訊息會否帶來贏利。過往之表現不一定反映未來之表現,AASTOCKS.com Limited不可能作出該保證及用戶不應該作出該假設。

AASTOCKS.com Limited也許連結訂戶或訪客至其有興趣的網站,但AASTOCKS.com Limited只提供此服務給訂戶或訪客並不為此安排負責。

AASTOCKS.com Limited對於任何包含於、經由、連結、下載或從任何與本網站/應用程式有關服務所獲得之資訊、內容或廣告,不聲明或保證其內容之正確性或可靠性。 對於閣下透過本網站/應用程式上之廣告、資訊或要約而展示、購買或取得之任何產品、資訊資料,本公司亦不負品質保證之責任。

AATV是AASTOCKS.com Limited旗下的視頻網站平台。

閣下確認:(i) AATV只為提供資訊,並不為了任何交易目的;(ii) AATV節目內容以及其提供的資料並不構成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦,或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務;及(iii)AATV並非為任何人士或法律實體在其他司法管轄區或國家使用,而在當地可能因該使用或分發而違反當地法律或法規。

AATV中節目內容中的個人意見和觀點僅供參考及討論,亦並不代表AASTOCKS.com Limited的立場。投資者必須按其本身投資目標及財務狀況自行作出投資決定。AASTOCKS.com Limited不對以下任何情況對閣下或任何人直接或間接負責:(i)AATV的不准確性,錯誤或遺漏,包括但不限於報價和財務數據; (ii)AATV中節目傳輸的延遲,錯誤或中斷; (iii)閣下由AATV中節目內容招致任何損失。

我們保留權利不時更改本免責聲明並於本網站/應用程式刊登更新版本。閣下必須定期查閱於本網站/應用程式刊登的資訊,以確保您即時知悉任何有關的改動。 如閣下於本免責聲明更新後仍繼續使用本網站/應用程式,即代表閣下同意接受更改後的本免責聲明的約束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免責聲明的中英原文如有任何岐異,一切以英文原文為準。

更新日期為: 2026年2月9日