近期,国际权威IT研究机构Gartner发布《2022中国网络安全技术成熟度曲线》(Hype Cycle for Security in China, 2022)报告。安恒信息入选数据安全平台、云安全资源池、智慧城市网络物理系统安全、态势感知、数据分类分级和攻防团队等6大领域代表厂商。报告同时指出,数据分类分级技术正处于稳步爬升复苏期,该技术正被越来越多的企业所应用。
2021年IBM数据泄露成本报告显示,全球平均单一事件数据泄露成本高达424万美元,数据安全已经严重制约业务数字化转型的进程。而将数据分类分级后的结果,应用于数据全生命周期安全防护,可以有效保障数字安全,满足业务数字化转型的安全需要。
Gartner报告也指出,数据的分类分级,是根据其重要性、价值性、安全性、访问性、可重用性、隐私性、存储性和保留性等,将数据区别对待,设置数据的不同安全级别。不同级别的数据在不同活动场景下,需要的安全防护措施也不尽相同。数据分类分级对数据安全、数据治理和合规项目至关重要。
安恒AiSort数据分类分级与风险评估系统,可以对庞大繁杂的数据进行快速梳理、分类分级。目前,安恒信息已经具备端-用-数全链路的数据风险监测与预警能力,同时实现了对数据全生命周期的安全防护能力。
该系统内置100多种通用敏感字段识别算法,支持丰富的敏感数据识别技术:包括正则表达式、关键字典、NLP、文档指纹等先进AI技术。同时支持自定义创建正则、关键字典、算法类数据分类分级规则。
对于有明确数据特征的个人数据做分类分级,传统的正则技术会更合适;对于没有明确数据特征的业务数据分类分级,自然语言实体识别算法(NLP)是解决这一问题的关键技术。安恒AiSort数据分类分级与风险评估系统同时具备这两类技术应用能力,实现传统与创新的完美融合。
该系统还内置AI机器学习算法规则和内置行业法规标准,基于“深度学习+条件随机场”的命名实体识别模型,可以更准确、高效地识别核心敏感数据,并自动对其进行分类、分级。此外,用户也可以按照指引导入自己企业内部的分级分类标准。
通过对数据表名、表注释、字段名、字段注释等多维度特征训练出推荐模型,系统可给出一个或多个分级分类命中标签,并给出分类分级推荐度排序。
基于聚类算法对相似表、相似字段进行分析并汇总后展示,系统支持批量确认分类分级结果,大幅提升梳理效率。
数字化是未来产业发展的关键,数据要素是数字经济深入发展的核心引擎。安恒信息将依托自身在数据安全方面的多年经验,大力推进数据分类分级的探索与实践,助力数据要素充分自由流通,发挥数据价值,促进数字经济发展,为建设数字中国提供优质服务。