天富平台公司 - 天富平台APP下载|天富平台代理【官网登录】

【天富娱乐代理注册】控制器让四足机器人在复杂地形上学习如何快速稳定的通过

地球上许多地形状况比较复杂,轮式和履带式无法通行,在恶劣的地形上,其稳定性也可能会受到损害。另一方面,四足机器人可以行驶更远的距离,他们可以在运动范围内选择安全的立足点,并根据环境迅速改变运动状态。

在各种复杂的自然环境中的动态运动对腿式机器人一直是一个巨大的挑战。这些地表环境具有高度不规则的轮廓,可变形的地形,光滑的表面和地面障碍物。在这种情况下,现有已发布的控制器会出现频繁的打滑,失去平衡,并最终导致灾难性故障。无法获得有关地形物理特性的准确信息使这一挑战更加严峻。

诸如相机和LiDAR之类的感受性传感器无法可靠地测量诸如摩擦和柔度之类的物理特性;受到植被,雪和水等障碍物的阻碍,有可能没有办法捕获机器人本身引起的变化的覆盖范围和时间分辨率,例如,机器人脚下的松散地面。在这种情况下 机器人必须严重依赖本体感受-在高时间分辨率下感测其自身的身体形态。为了应对意外事件,例如意外的地面接触,地形变形和打滑,控制器必须快速产生符合以下多个目标的全身轨迹:平衡,避免自碰撞,抵消外部干扰和运动。尽管动物本能地解决了这个复杂的控制问题,但它仍然是机器人技术领域的一个开放挑战。抵抗外部干扰和运动。尽管动物本能地解决了这个复杂的控制问题,但它仍然是机器人技术领域的一个开放挑战。抵抗外部干扰和运动。尽管动物本能地解决了这个复杂的控制问题,但它仍然是机器人技术领域的一个开放挑战。

《【天富娱乐代理注册】控制器让四足机器人在复杂地形上学习如何快速稳定的通过》

在不平坦的地形上进行腿式运动的常规方法产生了越来越复杂的控制架构。许多依赖复杂的状态机对坐标运动图元和反射控制器。为了触发状态之间的转换或执行反射,许多系统会明确估计状态,例如地面接触和打滑。这种估计通常基于经验调整的阈值,并且在存在诸如泥土,雪或植被等未建模因素的情况下可能会变得不稳定。其他系统在脚上使用接触式传感器,在现场条件下可能会变得不可靠。总体而言,随着更多场景的考虑,用于在崎terrain地形上进行有腿运动的常规系统的复杂性不断升级,在开发和维护方面变得极为费力,并且仍然容易遭受控制器设计无法实现的情况。

最近,无模型强化学习(RL)已成为腿式机器人的运动控制器开发中的一种替代方法。RL的想法是调整控制器以优化给定的奖励功能。对通过执行控制器本身获取的数据执行优化,这会随着经验的提高而提高。RL已被用来简化运动控制器,设计过程的自动化部件的设计,并得知无法与现有的方法。

但是,将RL应用于腿式运动很大程度上局限于实验室环境和条件。我们先前的工作证明了端到端的运动和恢复行为的学习,但仅限于在实验室的平坦地面上进行。其他工作还制定了腿运动RL技术,但也主要是集中在实验室设置扁平或中等纹理的表面。

在这里,我们提出了一种鲁棒的控制器,用于在充满挑战的地形上进行盲四足运动。控制器仅使用关节编码器和惯性测量单元的本体感觉测量,这是有腿机器上最耐用,最可靠的传感器。控制器的操作如图1和电影1所示。该控制器用于驱动两代ANYmal四足动物,这超出了有腿机器人先前发表的工作所无法达到的各种环境。四足动物在泥土,沙子,瓦砾,茂密的植被,雪,自来水和各种其他越野地形中可靠地小跑。我们在国防高级研究计划局(DARPA)地下挑战城市巡回赛的参赛作品中也使用了相同的控制器。在所有部署中,同一代机器人在所有情况下均由完全相同的控制器驱动。无需调整即可适应不同的环境。

Door Robotics推出全球首款内置摄像头无人机 可360度无死角拍摄

无人机,摄像头【天富娱乐最高待遇】【天富代理网址】

《【天富娱乐代理注册】控制器让四足机器人在复杂地形上学习如何快速稳定的通过》

基于机器学习的运动控制器使四足ANYmal机器人能够穿越充满挑战的自然环境。

像一些无模型RL到腿式移动的在先申请的,我们在训练仿真的控制器。先前的努力已经建立了许多实践,可以成功地将腿部运动控制器从模拟转移到物理机器。一种是包括致动器的物理系统的现实建模。另一个是在仿真和现实之间变化的物理参数的随机化,这样控制器就可以适应涵盖物理部署中出现的条件的一系列条件,而无需事先对这些条件进行精确建模。

我们也使用了这些想法,但发现它们不足以在崎terrain的地形上实现强大的运动。因此,我们引入并验证了许多其他方法,这些方法对于实现所介绍的技能至关重要。第一个是不同的策略体系结构。与先前工作中常见的做法不同,我们没有使用在机器人当前状态的快照上运行的多层感知器(MLP),而是使用了序列模型,特别是时间卷积网络(TCN),它基于本体感受状态的悠久历史。我们没有使用显式的接触和滑动估计模块,而已知的模块在挑战性的情况下缺乏鲁棒性。相反,TCN会根据需要从本体感受历史中隐式地推理出接触和滑动事件。

《【天富娱乐代理注册】控制器让四足机器人在复杂地形上学习如何快速稳定的通过》

能够证明结果的第二个关键概念是特权学习。我们发现直接通过RL训练越野运动策略并不成功:监控信号稀疏,并且所提供的网络无法在合理的时间预算内学习运动。相反,我们将培训过程分为两个阶段。首先,我们培训了一个教师政策,该政策可以访问特权信息,即对地面的真实了解和机器人与之的接触。特权信息使策略能够快速实现高性能。然后,我们使用这位特权教师指导纯本体感觉的学生控制器的学习,该控制器仅使用真实机器人上可用的传感器。该特权学习协议可通过仿真启用,但最终的本体感受策略不限于仿真,而是部署在物理计算机上。

在达到所提出的鲁棒性水平方面非常重要的第三个概念是一种自动课程,它根据控制器在训练过程的不同阶段的表现来自适应地合成地形。从本质上讲,地形是经过综合的,因此控制器能够遍历它们,同时变得更加健壮。我们评估参数的地形和使用粒子滤波来维持的中等难度的地形参数的分布。训练条件变得越来越具有挑战性,产生了一种将敏捷性与前所未有的弹性结合在一起的全向控制器。

结果就是一个有腿的运动控制器,它可以快读稳定地穿越通常由现有方法无法到达的复杂自然地形。控制器在零散点泛化设置中始终有效。也就是说,在训练期间从未遇到过的条件下进行测试时。我们的模拟训练仅使用刚性地形和少量程序生成的地形剖面,例如山丘和台阶。但是,当部署在物理四足动物上时,该控制器可以成功处理可变形的地形(泥,苔藓和积雪)。动态的立足点(在杂乱的室内环境中踩踏在板上或田野里有碎屑);以及地面上的障碍物,例如茂密的植被,瓦砾和喷涌的水。

【天富娱乐招商】【天富金融平台怎么样】

尖端的手术机器人技术帮助迪拜对抗新型冠状病毒

手术机器人

点赞