騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架「WorldCompass」,是一個專為長時序、交互式世界模型設計的強化學習(RL)後訓練框架。「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)相關內容《大行》高盛:雲端與數據中心列中國互聯網首選子產業 推薦阿里(09988.HK)及金山雲(03896.HK)等