>研究人员设计虚拟环境以刺激有用的家用机器人的发展
研究人员设计虚拟环境以刺激有用的家用机器人的发展
2020-11-05
www.jnmtv.cn 编辑:济南全搜索
没有太多的先验经验,孩子们甚至可以在新颖的场景中认出别人的意图,并提出帮助他们实现目标的计划。相比之下,即使是迄今为止最复杂的AI系统,也仍然难以与基本的社交互动进行交流。这就是麻省理工学院,英伟达大学和苏黎世联邦理工学院的研究人员开发监视与帮助(WAH)的原因,在这一挑战中,具体化的AI代理需要通过观看演示人在执行任务并与人协作解决问题的演示来理解目标。尽快完成任务。
体现人工智能的概念基于体现认知,即心理学的许多特征(无论是人类还是其他方面)都是由有机体的各个方面决定的理论。通过将此逻辑应用于AI,研究人员希望改善与聊天室,机器人,自动驾驶汽车甚至与环境,人和其他AI交互的智能扬声器等AI系统的性能。真正体现具体的机器人可以检查例如门是否被锁住,或者取回楼上卧室正在响起的智能手机。
在WAH的第一阶段(研究人员称为“观察”阶段),AI代理观察到类人代理执行任务并从其行为推断目标。在第二阶段(帮助阶段)中,AI代理协助类人代理在完全不同的环境中实现相同的目标。研究人员断言,这两个阶段的框架对人与人之间的AI协作构成了独特的挑战,因为AI代理必须推理类人代理的意图并归纳其关于目标的知识。
为了实现WAH中涉及的各种交互,研究人员不得不扩展开源平台VirtualHome并构建一个称为VirtualHome-Social的多代理环境。VirtualHome-Social模拟家庭设置,以便代理可以与不同的对象和代理进行交互,例如打开容器或从抽屉中抓取器皿。VirtualHome-Social还提供了模仿人类行为的内置代理程序以及人类玩家的界面。这样可以测试真实的人和在半真实的环境中显示的人类活动。
类人代理代表VirtualHome-Social中的内置代理。它基于目标和对环境的观察来计划其行动。在“帮助”阶段,AI代理在每个步骤都从系统接收观察结果,并发送回操作命令以控制虚拟化身。同时,类人代理(也可以由人控制)根据其最新观察更新其计划,以反映AI代理引起的任何状态变化。
研究人员设计了评估协议并提供了WAH的基准,包括Watch阶段的目标模型以及Help阶段的多个计划和机器学习基准。该团队表示,结果表明,要想在WAH中取得成功,人工智能代理商必须获得强烈的社会认知度和通用的帮助策略(如假设的那样)。
“我们的最终目标是建立可以与真实人类合作的AI代理。研究人员写道:“我们的平台为未来的工作开辟了令人兴奋的方向,例如在线目标推断和代理商之间的直接沟通。”“我们希望所提出的挑战和虚拟环境能够促进有关构建更复杂的机器社交智能的未来研究。”