3月22日,阿里巴巴人工智能实验室2018春季发布会上,阿里发布了搭载AliGenie2.0系统的“天猫精灵火眼”。只需要49元购买天猫精灵XHolder,天猫精灵X1的用户就能升级成天猫精灵火眼。
简单来说,在AliGenie 2.0系统加持下,天猫精灵火眼具备视觉认知和交互能力,可识别117套儿童读物(直接有声阅读)、40000种中国家庭常用药(说出药品名称、功效、用法以及保质期等),未来还将增加“万物识别”和“人脸识别”技能。
会后,阿里官方对AliGenie2.0系统和“天猫精灵火眼”进行了详细阐述。
据官方介绍,AliGenie1.0是阿里巴巴推出的第一代中文人机交流系统,通过“听”和“说”,带来了全新的交互体验。
AliGenie2.0在“听”和“说”的基础上引入视觉能力,能够进行视觉认知、多模态交互、情景感知。
其中,AliGenie 2.0的视觉认知能力包括图像识别、人脸识别、物体检测;AliGenie 2.0的多模态交互能力可以通过对语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式;AliGenie2.0的情景感知能力,则基于你所在的上下文、对话场景自主学习,深刻理解情景需求。
据了解,AliGenie 2.0首先将视觉能力落地在天猫精灵X1,通过搭载在天猫精灵手机APP的“精灵火眼”功能,以及天猫精灵XHolder,天猫精灵在几乎没有增加硬件设备成本的情况下,实现了视觉识别能力。
阿里表示,起名叫“精灵火眼”,意味着天猫精灵从此有一双炯炯的火眼,能看见、感知外部的世界,拥有视觉能力的天猫精灵,会给人们生活带来更大的帮助。
此外,精灵火眼提供了一个全新视觉系统,基于3D虚拟形象,提供自然交互的表情拟态动画,目前包括近20多种拟态动画,触摸虚拟形象的不同部位,能够产生反馈和互动,使用户体验从天猫精灵的语音交互升级为“精灵火眼”的自然互动。
面向儿童,精灵火眼能识别117套图书,通过图像识别,结合智能语音互动、声音朗读,帮助儿童读书、识字。面向老人,精灵火眼能够识别4万种药盒,覆盖中国家庭常用药,只要用精灵火眼扫一扫药盒,就能用语音播报药名、功效、过期日等信息。
阿里称,精灵火眼未来将推出“万物识别”、“人脸识别”等功能。