2月28日|據企查查,近日,優必選申請公佈“機器人控制模型的訓練方法、裝置、電子設備及存儲介質”專利。專利摘要顯示,方法包括:根據第一總獎勵函數對初始的運動控制模型進行訓練處理,得到第一運動控制模型;根據第二總獎勵函數對初始的導航控制模型進行訓練處理,得到第一導航控制模型;在維持第一導航控制模型參數不變的情況下,基於第一導航控制模型輸出的第一預測速度、第二子獎勵函數以及第一總獎勵函數,對第一運動控制模型進行訓練,得到第二運動控制模型;對第二運動控制模型以及第一導航控制模型的參數進行微調處理,得到用於控制機器人規避障礙物的模型。通過本申請,能夠通過導航控制模型和運動控制模型之間的強化學習,提升機器人的運動控制準確性以及效率。
新聞來源 (不包括新聞圖片): 格隆匯