阿里通義實驗室智能計算團隊推出新算法FIPO 財經新聞 Financial News

桌面版

推薦

利好

利淡

格隆匯新聞

AASTOCKS旗下aacat開證券戶口送NVDA

4月7日｜阿里通義實驗室智能計算團隊宣佈推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL機制，獎勵關鍵Token，解決純強化學習（Pure RL）訓練中“推理長度停滯”難題。據該團隊介紹，在32B規模的純RL設定下，率先實現對o1-mini與同規模DeepSeek-Zero-MATH的性能反超。

新聞來源 (不包括新聞圖片): 格隆匯

已將連結複製到剪貼簿

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

備註

(1) 所有香港指數為即時指數

主頁|即時報價|市場|新聞|指數
意見箱|免責聲明

查看: 手機|桌面
語言: 繁|简|EN

回到頁頂

聯絡我們
支援電郵: support@aastocks.com