Facebook发布最新AI技能,要让“任何物品皆可购买”成真——依据物品切割、检测和分类三个方面的进步。Facebook的长期方针是创立一个全面的AI驱动的体系,完成无缝消费。
5 月 19 日,Facebook 宣布推出商铺(Shops)功能,旨在让 Instagram 和 Facebook 能成为真正的线上购物场所,作为社交领域巨头,这一步举措却显示出了它的谨慎和克制。
根据 Facebook 最近一次财报电话会议显示,每月平均有 26 亿活跃用户通过其平台分享内容,预计在今年年底前,仅Instagram 的用户就将达到 1.125 亿。面对如此巨大的流量驱动,仅仅在应用程序上刷屏和“点赞”决不能再满足这个社交王者,它同时也在跃跃欲试开启自己的最新使命:挑战人工智能在购物领域的极限。
谈起人工智能技术,首先我们需要谈到 GrokNet,这项技术不仅可以读取图像,即时当某些视觉数据被覆盖,它仍能够分析出它的外观。简单的说就是智能识别照片中的服装,无论是在图像前景直接可见的,还是在拍摄对象身后人物身上穿的。Facebook声称,在很多情况下,该系统可以区分衬衫和连衣裙,以及绒面革领子和皮革领子,还可以自动标记商品和填写产品详细信息。
Facebook 人工智能部门负责人 Manohar Paluri 对 WWD 表示,这项技术的愿景是“通用产品识别”——消费者只需简单地拍张照片,系统可以在任何 Facebook 平台上挖掘出该产品的材料属性和品牌信息,当然这项技术成型的最终目标是在 Facebook所属的平台上销售产品,被发掘的商品都会附上链接,这意味着在消费者无需再去博主评论中“索要”商品品牌和链接,便可以轻松购买自己喜欢的服饰。
为了完成这一愿景,Facebook正在布置一种新的通用计算机视觉体系,称为GrokNet。规划这种新产品辨认模型的意图是使“几乎一切相片都能够用于购物”。
GrokNet目前为Facebook的点对点购物渠道Marketplace中的买卖双方供给功用。当卖家将相片上传到Marketplace时,体系会主动列出相应特点,例如产品的色彩或资料。
acebook表明,GrokNet能够检测出数十亿张相片中的准确、相似(经过相关特点)或一起呈现的产品,且在Marketplace上执行查找和过滤的功率至少是相似算法的两倍。
例如,与Facebook依据文本的归因体系(只能辨认33%)相比,它能够辨认90%的家庭和花园列表。
作为有限测验的一部分,除了在Marketplace卖家列出产品之前从图画生成色彩和资料的标签外,它还用于在页面管理员上传相片时在Facebook Pages上符号产品。
Facebook表明,在训练GrokNet的过程中,它运用了具有挑战性角度的真实卖方相片以及目录样式的价差。
为了使一切国家,言语,年纪,大小和文化尽或许地具有包容性,它抽样了不同体型,肤色,方位,社会经济阶层,年纪和姿态的示例。
Facebook开发了一种运用GrokNet作为反馈循环主动生成其他标识符的技能,而不是运用会花很多时间的产品标识符来手动注释每个图画,因为产品标识符已经运用了很长时间。
使用方针检测器,该办法能够辨认图画中或许产品周围的框,然后将框与已知产品列表进行匹配,以将匹配项坚持在相似度阈值内。结果的匹配将被增加到练习会集。
Facebook预计最终将需求新的体系来习惯不断改变的趋势和偏好,抱负情况下,该体系将从对潜在所需产品的图画的反馈中学习。
它最近在Fashion ++方面获得了进展,它运用AI来供给个性化的穿搭主张,比方增加皮带或半折衬衫。Fashion++ 依赖于一个深度图像生成神经网络,其特点是机器学习可以提出建议和预测,可以观察一套衣服,并提出一些细微的变化,比如把衬衫塞进去、翻动衣领或卷起袖子。
随着 Facebook 深度发展购物人工智能技术,零售观察者似乎对其前景感到兴奋。LiveArea 策略和产品主管 Chris Hogue 表示:“它可以汇总来自不同地区,风格偏好和社会群体的用户的购买量,从而为每个人量身定制想法。汇总的数据将是预测时尚新趋势的好方法,可以为平台上的商店提供热门产品指南,招募新零售商,并使他们的商品与流行趋势保持一致。” 或许,AI充沛渗透进实际,敞开交际无缝购物、智能穿搭帮手的那一天,离咱们真的不远了。
IoT与AIoT的最大区别,在于实际应用场景中,给予用户的体验或者工具不一样。如普通智能产品,搭载人脸识别技术的手机能够刷脸解锁;搭载语音识别、语音识别技术的音响能够实现语音交互。作为视觉领域的企业微美全息(WIMI.US),其开发的全息云系统作为微美全息独家的研发突破,其领衔的微美AI人脸技术应用,已得到业内多方的称赞。
面部识别技术,是基于人的脸部特征信息进行身份识别的一种生物识别技术。利用摄像设备采集人面部图像或者是视频,通过提取其中的关于面部图像特征,与数据库中存储的特征模板进行搜索匹配,当相似度超过设定阈值就会输出匹配成功,反之输出匹配失败结果。人脸识别是基于数字图像处理,数字图像处理一直都是比较前沿的研究方向。数字图像处理技术的后期就会发展为人工智能(AI)。
微美全息AI-MBTWIMI全息云平台,是公司开发的一款高性能WIMI全息云管理平台,主要用于为企业、团体、组织或个人提供AR3D应用&全息娱乐、AR3D应用&全息广告与AR3D应用&全息技术服务三大服务体系。云平台根据适用场景的不同分为To B\To C,两者在功能和特性的支持上存在一定差别。To B主要为广告、影院、家装、餐饮、娱乐、游艺等公司提供所需全息虚拟内容与技术支撑服务。To C端的应用主要提供微美WIMI全息云AI-MBTNSDK及其插件用在移动端摄影、APP应用之中提供各类个人增值服务,未来还可以应用在AR/虚拟现实/智能眼镜,DLP(数字光处理)投到视网膜;拥有SDK插件和智能计费系统等。
全息3D人脸识别软件的开发基于微美的全息成像特征成像检测和识别技术、模板匹配全息成像检测技术,以及基于深度学习和训练的视频处理和识别技术。传统的2D面部识别技术是一种基于面部特征的识别技术,它从面部图像或面部视频流中捕获信息,并自动检测和跟踪目标面部;微美的全息3D面部识别技术是全息成像捕捉和3D肖像的结合的识别技术。微美专注于软件技术的开发和应用,并拥有AI、机器识别技术、机器学习、模型理论和视频成像处理技术。全息3D面部识别技术是一种利用结构光和红外光的集合技术,所收集的特征点可以超过30,000点;并且3D技术受到周围环境的影响较小,有望克服传统2D面部识别技术中发现的如光线、姿势、遮挡、动态识别和面部表情等许多问题。
微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。
图像处理算法是人工智能(AI)的前奏,所以,其中的人脸识别对未来发展的意义也非常大。在未来,微美全息希望通过自身AI算法与云计算能力,与更多的硬件厂商展开战略合作,打造更多的智能设备,共同打造万物智能的美好时代。
随着技术的进步,这个载体可能是我们使用的任何东西,当识别精度和用户使用频次达到一定程度,市场消费环境演变到一定阶段,那个时候,无感支付将攻陷越来越多的支付场景。