为了能更长久的保存和方便检索,许多纸质书籍都有电子化的需要。在过去,人工操作扫描书籍是一项庞大的工作,不过日前瑞士的一家公司推出了一种新型扫描设备,最高每小时能够完成3000页,每天可以整理满满一书架的图书。
说起书籍扫描这件事,为了解决OCR不能正确识别的问题,Carnegie Mellon大学几年前开发了一种验证码技术,将不能正确识别的字符融入到我们日常使用的验证码中,如下图:
新的验证码系统由两部分组成,其中一部分为OCR不能正确识别的字符,而另一部分为已知字符,使用者只需识别出其中的已知部分就能通过验证,而OCR不能识别的部分就不知不觉的人力解决了。据称全世界每天会有6000万次类似的验证码操作,如果每次花费十秒钟,一天就是150000个小时,何不利用这些时间做些更有意义的事呢?
关于更详细的信息请参考:www.4digitalbooks.com/default.htm