天富平台公司 - 天富平台APP下载|天富平台代理【官网登录】

【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价

研究仿人机器人和人类复杂的认知运动表现,可以为其在团队动力学的社会背景下的互动提供参考。即,对人类认知运动控制和学习机制的理解可以为人类运动行为提供参考,也可以为机器人与人交互时智能控制器的开发提供参考。虽然之前的人类和类人机器人研究主要研究了运动规划,但只有少数研究了复杂任务执行的动作序列所依据的高级运动规划。这种稀少的工作主要考虑了使用相当简单的性能评估方法的良好约束问题,而没有详细的动作序列分析。在这里,研究者定性和定量地评估人类和仿人机器人在执行两个任务时产生的动作序列,提供不同的挑战水平和学习范式,同时提供灵活的成功标准。距离及其运算符适应于运动领域,以提供一个详细的性能评估的动作序列,通过比较他们的参考序列(完美序列具有最小的动作数量)。结果显示:(i)人类产生了大量结合完美和不完美序列的动作序列,同时仍能达到任务目标,而机器人则产生了完美/接近完美的成功动作序列;(ii)莱文施泰因距离和插入次数提供了可靠的性能标记,能够区分完美和不完美序列;(iii)删除算子是动作序列失败的最敏感标记。这项工作是对之前人类和仿人机器人复杂任务性能评估工作的补充,有可能为人机交互提供参考。本文以“High-Level Motor Planning Assessment During Performance of Complex Action Sequences in Humans and a Humanoid Robot”为题于2020年8月17日发布于《International Journal of Social Robotics》杂志上。

《【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价》

研究背景与过程

与低水平的感觉运动规划相反,有限的努力研究了高水平的认知-运动规划功能,这些功能涉及多步运动动作序列,以实现复杂的任务。对人类或机器人执行的复杂认知-运动任务的性能进行新的测量,可以为机器人检测和适应人类队友的技能水平提供新的手段,从而促进合作和信任。特别是,基于距离的测量通过量化人类和机器人执行任务的方式来实现这一目标。这种基于距离的评估也可以被机器人社区用来联系和分享他们各自的人类合作者的知识,从而成为有社会知识的伙伴。

大多数关于人类高水平运动规划的研究主要考虑的是约束任务,即个人按照特定规则规划行动序列,并且没有不同的挑战条件和/或实践范式(例如河内塔)。此外,行为分析在很大程度上是基于基本指标。这项先前的工作提供了有限的关于行动序列的信息,因为没有迹象表明哪些特定动作被添加、移除或切换,在哪些特定位置,在序列中–对于评估高层规划绩效至关重要的信息。这种有限的检查未能充分了解人类的神经认知过程、智能机器人控制器的开发和评估,以及在复杂任务表现(例如设备维护和清洁)中的人机交互作用。

因此,在复杂的动作序列中,需要检查人类和类人机器人的性能。在此,研究者重点讨论了在不同的挑战和学习范式条件下,可以在很少的约束条件下执行的动作序列和灵活的成功准则(该序列可以以多种方式执行,同时仍能达到其目标)。研究者的主要兴趣是在人类和类人机器人必须学习一项复杂任务时,提高他们对高级运动规划的描述和理解。事实上,在现实世界中,许多任务可以用动作序列来执行,这些动作序列可能无法达到任务目标,但在许多方面仍然可以达到相同的目标。还可能存在一种(或多种)方法来以最少的操作数有效地执行任务。因此,学习可以产生不同程度的成功和效率,这取决于所生成的序列是否有最少的行动数量。因此,执行者可以产生(一)一个成功的行动序列,以最少的行动数达到规定的任务目标;(二)一个具有附加步骤的行动序列(例如,添加额外的行动),但仍然成功地达到该目标,或者(三)实现该目标的失败尝试。

通过试验或模仿学习动作序列与人类基本的认知-运动机制高度相关,并允许类人机器人通过社会交流学习,避免繁琐的手工编程。在这里,研究者采取了一些第一步来详细检查复杂动作序列的性能,无论是在仿人机器人中,还是在人类实践复杂任务时,人类都提供了任务目标或要复制的特性。

该研究的主要目的是建立一种测量动作序列相似性的计算方法,研究复杂动作序列的高层结构,以评估人类和仿人机器人在各种挑战和学习条件下的性能。具体而言,研究者利用动作序列相似性来确定以下原因的功能原因:(一)复杂动作序列的性能失败(动作操作导致了这一失败)和(二)有和没有最小动作数的成功序列之间的性能差异。有趣的是,其他科学领域,如生物学中的DNA序列分析或语言学中的音素序列分析,也遇到了类似的问题。这些字段提出了根据编辑距离进行序列比较的解决方案,后者计算了将一个序列转换为另一个作为参考序列所需的碱基/音素的加法、删除和替换数(大量修改表明这两个序列进一步不同。

因此,从生物学和语言学领域中汲取灵感,研究者在这里部署了一种基于LD的计算方法,以研究在动作序列中添加、省略或替换操作如何影响学习任务的性能结果(即失败与成功)。研究者考虑存在以下情况的任务:(I)只有一个唯一的序列以最小的动作数到达目标,并作为参考;(Ii)可以生成的、与最小序列不同的为成功实现目标而生成的无穷多个动作序列。这种定量分析在定性上得到图形表示(序列比对显示)的补充,以进一步说明人类和仿人机器人与参考序列相比所产生的动作序列的任何变化。也就是说,即使在参考序列的关键要素之间增加额外的行动,也可能不是失败的主要决定因素,尽管行动序列长度有所增加,因为这些关键部件的顺序得到了保留(任务仍可正确执行并实现其目标)。但是,除非补偿,否则省略或替换参考序列的操作可能会对任务的成功完成构成更大的威胁。如果这些假设是正确的,研究者预测在失败期间,动作遗漏和/或替换的发生应该更加突出,当成功地执行(步骤最少与否)复杂的动作序列时,应该是最小的或空的。应通过定性(例如,序列比对显示)和定量(例如,行动频率、遗漏或补充)分析来一致地观察结果。如果该研究提出的计算方法具有一定的通用性,那么它应该在涉及各种挑战和学习范式的不同任务中提供一致的定性和定量结果,无论执行者是仿人机器人还是人类。

为了检验研究者的计算方法是否具有足够的通用性,可以成功地评估不同情况下的行动序列绩效,以促进错误和/或策略的多样化,研究者考虑了两项涉及不同挑战和学习条件的任务。第一项任务涉及一个相当短的运动序列,由八个动作组成,包括维持硬盘对接站(HDD),以及有限的规则和灵活的成功标准,机器人和人类通过模仿学习以类似的方式接受训练。与HDDS任务相比,第二项任务的目标是大幅度增加挑战条件,并允许不同的学习范式来解决修改后的河内塔(TOH)任务。

12名人类参与者和一个仿人机器人(巴克斯特;重新思考机器)不得不执行一项复杂的任务,其中包括一个模拟硬盘对接站。

《【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价》

图为对接站示意图

HDD任务具有灵活的成功完成标准,并且限制了以非常灵活的方式执行现实世界的任务。在先前的认知机器人研究中,它被用于研究类人机器人的高级计划生成,并且非常适合于在模拟动作序列过程中检查各种表演者(人类和仿人机器人)部署的动作序列。它使用给定的演示作为参照系行动次数最少的。

具体来说,通过一个由人控制的接口操作的微笑虚拟环境,视频演示了这个由八个原子动作组成的复杂动作序列,按以下顺序执行:(1)抽屉被拉开以打开船坞,以便打开四个硬盘驱动器插槽、相应的开关开关和LED(抽屉打开时缩写为;(2)故障驱动器(这里是第一个驱动器)必须按下开关开关(即T1,第一个开关),才能通过按下开关开关(T1,第一个开关)来关闭;(3)必须将硬盘驱动器从其插槽(Ud1)中取出,(4)丢弃在垃圾桶(Db)中;(5)捡起一个新的备用驱动器(USP); (6)插入空的第一个插槽(DS1);(7)再次按相同的切换开关(T1)打开绿色LED,(8)关闭抽屉(DRC)。

当这项研究的人类参与者通过观看微笑视频来练习这项任务时,仿人机器人并没有处理原始的视频片段。具体来说,对于人类来说,多个大脑区域(如背侧和腹侧流)将被用于视觉处理和编码构成视频中所显示的序列的动作,而这样的过程并没有在控制机器人的神经认知结构中建模,因为它的重点是实现高层次的规划机制。然而,对于机器人来说,自动生成的微笑事件记录为其神经认知结构提供了基于文本的视频转录。这个事件记录相当于一个转录显示的低水平动作序列,机器人利用其先前的知识,根据他们的行动推断演示者的目标。然后,通过规划自己的(可能不同的)行动来实现同样的目标。

人类参与者练习同样的模仿任务。首先,在观看任何演示之前,驯化阶段使参与者能够熟悉物理磁盘驱动器码头站。提示提供了说明,包括红色和绿色LED的含义,重要的是,也表明LED应该关闭时,添加或删除硬盘驱动器。一旦这个熟悉阶段完成,视频就会显示出来,向不得不学习模仿的人类参与者演示动作序列。每名人类参与者进行了五项试验,每一项试验的结构如下,使用相同的视频,以避免由于学习可能从一项任务转移到另一项任务而产生的任何可能的混淆因素。在每一次审判开始时,通过提示符(也是口头的)在计算机监视器上提供指令。演示结束后,参与者必须模仿先前观察到的动作序列。

针对社交研究的通讯移动机器的设计和控制

机器人,【天富企业代理】【天富平台最高奖金】

这项任务的成功需要两个方面:(一)完成目标,即用放置在对接站顶部的备用硬盘取代有故障的硬盘;(二)遵循在增加或移除硬盘驱动器时应关闭LED的基本原则。

研究者的机器人模拟学习系统,Ceril,是一个人工智能系统,执行非平凡的因果推理。

它使用内置的因果知识来推断演示者的高水平目标,并模仿目标而不是行动。与模拟演示者的死记硬背不同,模仿目标可以使机器人概括到新的情况(例如,不同的LED颜色插槽中不同数量的驱动器,以及备用驱动器的不同数量和位置)。由于类似的原因,机器人模仿者所使用的动作序列可能与模仿同样演示的人类学习者的动作序列大不相同。

对动作序列的分析表明,在这两项任务中,所执行的试验包含了大量的序列,其中成功的序列不包含任何缺失,与失败的序列相反,没有或很少的替换算子。对于这两种任务,插入数明显大于成功的不完全序列的缺失和替换数,表明LD的增加主要是由插入驱动的。对于失败的行动序列,LD对这两个任务的贡献往往更多地分布在三个操作符之间,而插入的数目明显大于HDD和TOH任务的替换数。

《【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价》

图为参考序列T的全序列对齐

《【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价》

图为平均LD和三个操作符的数目为人类参与者的失败(暗灰条)、不完美(灰度条)和完美(黑条;完美复制的演示)成功的动作序列

《【天富平台主管】仿人机器人:对复杂动作序列的高水平动作规划的评价》

图中LD、插入数、删除和替换数与失败(a),完美(b)和成功但不完美(c)动作序列的执行

最后,通过分析构成参考序列的八个动作的开头、中间或结尾,对人类数据进行分析,以探讨任何最近和优先的影响,但对于失败或不完美的成功动作序列,没有显示出任何显著的差异。

实验结论

总的来说,当考察人类个体和类人机器人在这两项任务中所产生的动作序列,涉及不同数量的挑战和学习时,主要发现:(1)人类参与者在这两项任务中不仅在成功与失败方面,而且在不完全成功试验中使用的不同策略上,都产生了各种各样的行动序列,而类人形机器人通常在一次试验后就会产生完美或接近完美的序列;(2)LD和插入数可靠地区分完美和不完美的成功尝试,(3)删除是最敏感的失败标记,是造成业绩失败的主要因素,而不依赖于该研究所考虑的挑战水平、学习范式和表演者类型。

这项工作只是在定性和定量地检查人类和机器人在复杂动作序列练习中的认知-运动表现结果的第一步。研究者的结果通过量化行动序列之间的差异,为那些已经存在的评估复杂任务性能的指标提供了不同但互补的度量。认知-运动领域中的LD可以在现实世界的相互作用所固有的物理约束的背景下使用不同程度的抽象。虽然LD信息丰富,但其特定操作人员的出现在某种程度上可以提供一个更精确的认知-运动性能评估。而且,虽然这项工作是在人类和机器人中进行的,但它也可以在运动表现和学习的背景下专门应用于其中一种或另一种。研究者的方法不仅允许研究者通过评估两个给定序列之间的相似性来检查认知-运动性能,而且还可以识别这些差异的来源(例如,如果两个序列的某些特定部分相似/不同,此时这些序列不同(发生分支时),则最近/优先效应)。因此,虽然提议的方法实现起来相当简单,并不是衡量性能的一般标准,还需要进一步的工作,但它提供了丰富的信息,扩展和补充了现有的其他更基本的度量标准。

此外,研究者采用了作为最优性标准的最小行动数,因为研究者的方法旨在评估高层次规划,这基本上与行动的数量和顺序有关,这是人类规划研究中通常考虑的参数。

最后,研究者注意到这里只考虑了几个试验,因此可以采用同样的计算方法来捕捉学习动力学。未来的工作可以进一步检查人类和仿人机器人的性能,同时考虑(一)额外的任务,以进一步评估这种基于LD的方法的性能结果标记,(二)更多的试验来评估整个实践过程中的学习动态,这应该被LD及其操作者捕捉到,(Iii)通过考虑更复杂的LD计算(例如,换位操作,正常化),或者在团队动态的社会环境中,除了LD之外的其他字符串距离度量。

参考文献:Theresa C. Hauge, Garrett E. Katz, Gregory P. Davis, Di-Wei Huang, James A. Reggia & Rodolphe J. Gentili High-Level Motor Planning Assessment During Performance of Complex Action Sequences in Humans and a Humanoid Robot International Journal of Social Robotics (2020)

【天富平台安全吗】【天富娱乐的代理是谁?】

“你的机器人朋友们在做什么?”:远程操作机器人团队成员意识的图形和技术设计探讨

机器人,

点赞