如果像亚马逊和谷歌这样的公司有自己的方式,我们很快就会有机器人从天而降的空气供应。但是,我们的软件需要在现实世界中移动和交付货物吗?

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员多年来一直在研究这个问题,他们研究的场景灵感来自工厂车间和无人机交付等领域。

在最近的机器人科学与系统(RSS)会议上,CSAIL团队展示了一个由三个机器人组成的新系统,这些机器人可以一起工作,以便在不可预测的环境中快速,准确地(或许最重要的)提供物品。该团队表示,其模型可以扩展到各种其他应用,包括医院,灾难情况,甚至餐馆和酒吧。

为了展示他们的方法,CSAIL研究人员将他们的实验室转变为一个微型“酒吧”,其中包括一个PR2机器人“调酒师”和两个四轮Turtlebot机器人,这些机器人将进入不同的办公室并向人类参与者询问饮料订单。然后,Turtlebots推断出不同房间需要哪些订单,以及其他机器人何时可以提供饮料,以便最有效地搜索新订单并将物品运送到空间。

该团队的技术反映了最先进的规划算法,这些算法允许机器人组执行任务,而不仅仅是对要解决的一般问题的高级描述。

在RSS文件,它被评为优秀论文入围奖,是由美国杜克大学教授,前CSAIL博士后乔治Konidaris,麻省理工学院研究生沙龙安德斯和加布里埃尔·克鲁兹,麻省理工学院的教授共同撰写乔纳森如何和Leslie Kaelbling和主要作者克里斯·阿马托,曾任CSAIL博士后,现任新罕布什尔大学教授。

人类的一个确定性:不确定性

让机器人一起工作的一大挑战是人类世界充满了如此多的不确定性。

更具体地说,机器人处理与传感器,结果和通信有关的三种不确定性。

“每个机器人的传感器都得到关于自身及其周围事物的位置和状态的不完美信息,”阿马托说。“至于结果,机器人可能会在试图捡起物品时丢弃物品,或者花费的时间比预期的要长。而且,最重要的是,机器人通常无法通过通信噪音或因为它们超出范围而彼此通信。“

这些不确定性反映在团队的交付任务中:除此之外,供应机器人一次只能为一个服务员机器人服务,机器人除非彼此靠近,否则无法彼此通信。诸如此类的沟通困难是救灾或战场情景中的特殊风险。

“这些限制意味着机器人不知道其他机器人正在做什么或其他订单是什么,”安德斯说。“它迫使我们开发更复杂的规划算法,让机器人能够对其位置,状态和行为进行更高层次的推理。”

研究人员最终能够开发出第一种规划方法,以展示针对所有三种不确定性的优化解决方案。

他们的关键见解是对机器人进行编程,以便像人类一样查看任务。作为人类,我们不必考虑我们采取的每一个脚步; 通过经验,这种行为成为第二天性。考虑到这一点,该团队对机器人进行编程,以执行一系列“宏观行动”,每个行动都包含多个步骤。

例如,当服务员机器人从房间移动到酒吧时,必须为几种可能的情况做好准备:调酒师可能正在为另一个机器人服务; 它可能没有准备好服务; 或者机器人根本无法观察到它。

“你希望能够告诉一个机器人去第一个房间,一个人拿到饮料而不必在整个过程中完成每一个动作,”安德斯说。“这种方法在这种灵活性方面有所折叠。”

该团队的宏观行动方法,称为“MacDec-POMDPs”,建立在先前的计划模型之上,这些模型被称为“分散的部分可观察马尔可夫决策过程”或Dec-POMDP。

“这些过程传统上过于复杂,无法扩展到现实世界,”利物浦大学计算机科学教授Karl Tuyls说。“麻省理工学院团队的方法可以在更高的层次上规划行动,这使他们能够将其应用到实际的多机器人设置中。”

研究结果表明,这种方法很快就可以应用于更大,更复杂的领域。Amato和他的合作者目前正在林肯实验室测试更大的模拟搜索和救援问题中的规划算法,以及国际空间站的成像和损伤评估。

“几乎所有现实问题都存在某种形式的不确定性,”阿马托说。“因此,这些规划方法有很多领域可以提供帮助。”