2016年至2017年间,上海某公司利用网络爬虫盗取某视频平台的短视频数据,被判罚2万元;某科技公司利用网路爬虫,非法获取的简历超过2亿条,并以13800元每年的价格卖给有需求的企业,公司法人王某某等36人被检察机关依法批准逮捕。
2019年下半年,多家涉及爬虫技术的大数据公司被调查引发业内外关注。根据网上传出的一封某银行函件称,某信用卡管家App全方位且数量巨大的获取用户个人信息。该银行督促该信用卡管家App立即停止针对银行用户网银数据和其他个人信息的抓取行为。
恶意网络爬虫通过程序去模拟人类上网、浏览、下载行为,然后抓取、复制所需要的信息。不仅造成重要数据被盗取,更会影响正常运营秩序。导致服务打开缓慢、甚至瘫痪等。
数据被盗取背后的网络爬虫
顶象最新发布的《验证码“适老化”白皮书》表示,在数字化逐步普及的今天,数据是企业重要资产。非法爬取、盗用、盗取的爬取行为,不仅造成企业数字资产损失,带来直接的经济损失,更消耗了平台服务和带宽资源,影响业务健康发展。
非法盗取数据背后是恶意网络爬虫,简单来说就是一个自动抓取网络数据的程序,比如搜索引擎大量使用的就是这种技术。《验证码“适老化”白皮书》中,系统总结了恶意网络爬虫盗取数据的三大危害。
窃取用户隐私。非法爬取政务和企业的敏感信息,造成用户隐私数据泄露。例如,非法盗取金融机构个人信息、招聘网站简历数据、App或网站用户账号密码,然后进行转售牟利等。
影响业务运营。非法爬取企业业务数据,影响业务的正常运营。例如,非法爬取航空公司的航线、航班、票务数据、哄抢低价机票进行加价倒卖等。
带来资产损失。非法爬取平台独有的数据,不仅造成资产损失,用户流失,更破坏了商业生态。例如,非法盗取视频网站内容、教育品平台课程、文学网站的小说、咨询平台的报告等。
验证码能有效防范恶意爬虫
验证码能够阻挡恶意爬虫盗用、盗取数据行为,防止个人信息、金融数据泄露等风险。
顶象无感验证提供动态策略的纵深防护,它集设备指纹、行为校验、操作校验、地理位置校验等多项功能与一身,基于设备、时间、访问频率、操作轨迹等信息,智能分析与预先判定操作者是合法用户还是仿冒者,进而判断是否需要弹出验证码:对于合法用户,免验证即通过;对于异常用户,根据潜在风险等级进行二次验证或直接拦截。既保障安全,又提升操作体验。
以某航空公司为例。在部署无感验证后,该航空公司的B2C平台上99%的恶意爬虫请求被直接拦截,正常用户访问占比提高至90%,访问效率提高10倍以上,用户体验满意度上升21%,每年为航空公司节省89%的查询开支。
顶象是国内领先的业务安全公司,旨在帮助企业构建自主可控的业务安全体系,实现业务的可持续增长。截止目前,已为中国银联、中国银行、交通银行、中信银行、平安银行、江苏银行、宁波银行、南京银行等数十家金融机构提供专业服务。