騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架「WorldCompass」,是一個專為長時序、交互式世界模型設計的強化學習(RL)後訓練框架。「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)相關內容《大行》花旗:Google Play拆賬改革利好遊戲開發商 騰訊(00700.HK)網易(09999.HK)受惠