Google已可通过OCR检索扫描PDF文档
  • 上方文Q
  • 2008年11月01日 16:33
  • 0

过去,电子扫描文档很少被纳入搜索结果中,因为受技术限制,我们对其中的具体内容不是很有把握,顶多只能针对文档标题进行检索。

Google产品经理Evin Levey自豪地宣布,这一切在今天都不同了,因为Google已经可以对任何Adobe PDF格式的扫描文档进行OCR检索,将其转换成文字并纳入索引,在用户搜索的时候就能显示在结果里了,很多重要的文件也可以轻松找到了。

Google表示,这是搜索技术上一个微小而重大的进步,也是Google致力于让全球信息都能轻松检索、使用的宏伟目标的一部分。

遗憾的是,Google没有透露这种技术现在都支持哪些语言,但估计是以英语为主,中文可能性不大,毕竟难度太大了。

点击下边的链接就能看到Google的最新成果了。注意搜索结果已经包含了被检索文档的内容提要,用户既可以直接下载PDF文档并打开原始拷贝,也可以选择“View as HTML”以网页的形式查看Google OCR识别后的结果。

[repairing aluminum wiring] [spin lock performance] [Mumps and Severe Neutropenia] [Steady success in a volatile world]

Google已可通过OCR检索扫描PDF文档

 

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0