日前,谷歌研究院在图像识别领域取得新进展,根据其科学家发表的文章显示,未来谷歌的图像识别引擎不仅仅能够识别出图片中有什么,还能用一句话对整个图片内容进行准确描述。
据悉,该技术基于机器语言翻译,通过通过一种递归神经网络(RNN)将一种语言的 语句转换成向量表达,并采用第二种RNN将向量表达转换成目标语言的语句。
谷歌所做的是,将以上过程中的第一种RNN用深度卷积神经网络(CNN)取代,而CNN可以用来识别图像中的物体。
科学家表示目前研究仅处于早期阶段,但描述简单的场景已经比较合理了。
日前,谷歌研究院在图像识别领域取得新进展,根据其科学家发表的文章显示,未来谷歌的图像识别引擎不仅仅能够识别出图片中有什么,还能用一句话对整个图片内容进行准确描述。
据悉,该技术基于机器语言翻译,通过通过一种递归神经网络(RNN)将一种语言的 语句转换成向量表达,并采用第二种RNN将向量表达转换成目标语言的语句。
谷歌所做的是,将以上过程中的第一种RNN用深度卷积神经网络(CNN)取代,而CNN可以用来识别图像中的物体。
科学家表示目前研究仅处于早期阶段,但描述简单的场景已经比较合理了。