578
1
1456 小时
管理员
策略搜索和模型预测控制 (MPC) 是机器人控制的两种不同范例:策略搜索具有使用有经验的数据自动学习复杂策略的优势,而 MPC 可以使用模型和轨迹优化提供最佳的控制性能。通过使用策略搜索为MPC自动选择高级决策变量来提供答案,这形成了一个新的策略搜索模型预测控制框架。具体而言,将 MPC 表述为参数化控制器,其中难以优化的决策变量表示为高级策略。这种表述允许以自我监督的方式优化政策。
来源:YouTube
作者:UZH Robotics and Perception Group
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页
登录账号
注册账号