婴儿期服务机器人更依赖场景 强化学习可提升机器人智能水平
“服务机器人是人工智能的一个载体,针对不同的场景,比如工业场景、养老场景、特种场景等,具有不同的功能。”在近日举办的第二十二届中国科协年会机器人与人工智能产业发展论坛上,澳门科技大学教授、澳门人工智能与机器人学会理事长韩子天表示。
“在我读书的时候,一个机器人的售价约是60万元到80万元,10年以前30万元,现在变成了15万元,国内的售价多少呢?大概在8万元左右。”北京航空航天大学机器人研究所名誉所长王田苗表示,机器人的普及脚步已经越来越快。
据亿欧《2020中国服务机器人产业发展研究报告》,人工智能技术的突破、核心零部件成本的下降,加速了服务机器人在各领域的渗透。近五年,中国服务机器人行业增速高于全球平均增速,市场规模占全球比例超25%,同时在产业链、产业环境等方面都具备全球竞争优势,在疫情催化之下以及数年的持续高速增长基础上,中国服务机器人产业未来仍将迅速扩张且潜力巨大。
但专家们也普遍表示,目前的服务机器人在智能化水平、尤其是自主交互方面还相当于婴幼儿,这既是机器人产业化的障碍,也是未来应该主要发力的地方。
交互性差限制服务机器人发展
王田苗例举了未来人工智能机器人可能应用前景广阔的几个方向:如企业服务领域中的机器人代理;医疗健康领域中养老、手术机器人,智能假肢等;智慧城市领域中的安防、消防、环保,以及物流、无人驾驶、金融科技等。“大量应用人工智能的机器人将支撑高效丰富的物质生产活动和生产要素的重构。在这种背景下,我们再来讨论人工智能和机器人未来发展的格局是什么。”王田苗说。
“机器人最大的优点是可以做一些重复性、危险性或者人类厌恶的工作,比如安防工作,人不愿意在晚上巡逻或者值班,这些岗位就可以由服务机器人去替代。所以不能说服务机器人是完全来跟人类竞争的,服务机器人更多的是对人类工作的补强、增强。”韩子天说。
但在王田苗看来,目前适合服务机器人的工作,环境还是比较固定的,作业流程标准化,工作比较繁重、单调、枯燥;而在幼儿教育和护理、老人的护理等方面,服务机器人还“爱莫能助”。在荷兰代尔夫特理工大学副教授詹斯·科伯(Jens Kober)看来,机器人利用人工智能能做的事情,主要与认知和高级推理有关,但是目前机器人还不具备这些能力,此外,在实际的运动方面和与环境的交互方面还需要进一步发展。
韩子天同样表示,机器人目前并没有思想,也没有自主意识。虽然它可以进行视觉感知、语音感知等,但是归根结底,目前的机器人没有自主思想,也没有办法进行很好的自主决策,没有思想和知识体系,不能和人类很好地交互。
婴儿期服务机器人更依赖场景
“服务机器人就像刚出生的婴儿。在很多新的技术比如视觉技术、语言技术发展比较成熟的时候,才会有比较好的服务机器人出现。”韩子天说,而通用型服务机器人目前是很难实现的。
“所以,服务机器人的发展,到目前为止,更依赖场景。这和工业机器人很像,工业机器人在生产流程定义清楚的情况下才能用,服务机器人也是一样,也要把它的服务场景定义清楚,做一个工作规划,服务机器人才能投入到工作的场景里面去使用。”韩子天说。他强调,这就是服务机器人的场景依赖。人把场景定义清楚,把机器人的行为定义清楚,才能做出比较有用的服务机器人。
旷视科技副总裁王银学举了个AI堆垛机的例子,在立体仓库里,货码得再整齐,也不可避免会掉下来,这往往会导致货被压碎。而在堆垛机上装一个摄像头后,不仅仅能观察货物掉落情况,AI系统还可以通过运行轨迹反算出是从什么地方掉下来的,并预判掉落情况。此外,堆垛机上不仅装了摄像头,还装了远红外探测设备,随时巡逻,如果局部温升超过一定程度就会报警,预防火灾发生。此类固定场景、固定模式的人工智能机器应用,效果立竿见影。
“机器人跟智能设备重要的区别在于机器人有行为,我们甚至希望它以后有自主行为。”韩子天表示,我们所说的场景依赖,比如养老场景、车载场景、医疗场景、安防场景等,这些场景就相当于机器人服务的边界,重要的是它在这个服务边界里面有什么行为。
强化学习可提升机器人智能水平
“过往的很多设计里面,机器人都是很被动的,用语音问询机器人一些情况,或者与机器人一些特定场景的问答,机器人的回答流程标准化。现在机器人社交方面的功能越来越多,在一些场景比如服务于养老院,或者与儿童交互,主动交互成为新热点。”詹斯·科伯介绍说,所谓主动交互,是希望机器人该讲话就讲话,该不讲话就不讲话,做一个懂你的机器人,主动交互的设计因此成为一个非常重要的内容。
“机器人是拟人化的设备,它的社交性非常重要,机器人跟机器人之间是不需要语音的,但是跟人的交互是需要语音交流的,语音的交互或者说行为的主动交互,它的边界在哪里,它的适度在哪里,都是近几年业界比较关注的。”詹斯·科伯表示。
而难点也在于此。“是什么导致机器人很难完成复杂任务?很大一部分原因在于复杂的动力学,即机器人如何与周围的环境交互。与物体、环境和任务交互中会出现很多不确定性和变化,如果机器人要与人类交互,情况可能会更复杂。”詹斯·科伯说。
那么机器人是怎么学会一项新技能的呢?詹斯·科伯表示,通常来说,机器人学习新事物有两种不同但互补的方式。第一种是模仿学习,即老师示范一项技巧,然后学生试着模仿,这种方式适用于简单的学习,但对于更复杂的任务,机器人更需要强化学习,强化学习是一种以“试错”的方式进行的学习方法,其目标是让人工智能在特定环境中能够采取回报最大化的行为。如果机器在学习的过程中做对了就会得到相应奖励,错了则无奖励,这种学习方法可以让机器在和环境的互动中明白什么是对的行为,什么是错的行为,而不是通过大数据让机器“死记硬背”。詹斯·科伯强调,强化学习能让机器加快学习过程,从而能完成更复杂的任务,对人类来说,通过这种方式进行教学也相当直观。这也是未来机器人加强学习和交互能力的可行路径。