3月1日晚间,微盟官方宣布,数据已经全部找回,将于3月3日上午9点恢复正式上线,同时也公布了详细的商家赔付计划,总额1.5亿元。
2月25日,微盟官公告称服务出现故障,大面积服务集群无法响应,生产环境及数据遭受微盟研发中心运维部核心运维人员贺某的严重破坏。
根据最新公告,截止到3月1日晚8点,在腾讯云团队的协助下,经过7×24小时的努力,微盟的数据已经全面找回。
不过由于此次数据量规模非常大,为了保证数据一致性和线上体验,微盟将于3月2日凌晨2点进行系统上线演练,在此期间微盟系统会停止服务,演练完成后系统数据回滚到3月2日。
3月2晚上10点至3月3日上午9点,微盟正式进行数据恢复上线,恢复至2月23日之前的数据,同时将2月23日与3月2日的数据进行合并,届时所有数据恢复完成。
由于此次事故给商家经营造成了严重的影响,微盟准备了1.5亿元人民币赔付拨备金,其中公司承担1亿元,管理层承担5000万元,包括董事会主席兼CEO孙涛勇3500万元,公司执行董事兼CTO黄骏伟500万元、公司执行董事兼智慧商业事业群总裁方桐舒500万元、公司执行董事兼智慧营销事业群总裁游凤椿500万元。
在紧抓数据恢复的同时,微盟也在同步研究商家赔付方案,并拟定了现金赔付计划、流量赔付计划供商家选择。
微盟表示,事故发生后,加强了内部流程控制管理,同时邀请外部数据安全专家一起评估数据安全保障方案,并迅速制定了一份数据安全保障计划,以杜绝此类事故的再次发生。
一、事故经过
2月23日,微盟员工恶意破坏公司线上生产环境及数据,导致系统服务不可用。目前,该犯罪嫌疑人已被上海市公安局宝山分局刑事拘留。
2月25日,微盟紧急恢复核心业务的线上生产环境,新用户使用不受影响,并提供老用户临时过渡方案。
2月28日,微盟恢复所有业务的线上生产环境,开放老用户登录,恢复微站产品的所有数据。
3月1日晚8点,微盟全面找回数据。
二、事故责任
微盟强调,此次事故虽由“人祸”引起,但公司管理层有着不可推卸的责任。
首先,公司董事会主席兼CEO孙涛勇没有对数据安全引起高度重视,没有对数据安全保障方案进行深入的评估和审查,没有聘请外部专家顾问团队对数据安全进行评估和测试,没有把数据安全管理纳入到日常管理范围。
其次,公司执行董事兼CTO黄骏伟,作为公司技术负责人,没有对数据安全引起足够重视,没有严格按照公司的内控管理制度,对运维人员的权限进行分级和分区管理,对于数据安全技术体系的建设和引入,缺乏全局和前瞻性设计,对于安全监控体系没有执行到位。
公司执行董事兼智慧商业事业群总裁方桐舒,作为SaaS业务负责人,没有对数据安全引起高度重视,没有严格执行公司内控管理制度并推动研发侧加强数据安全管理。
三、赔付计划
出于对商家因系统不可用而造成的利润、流量损失,微盟的赔付计划做了两个不同的方案,供商家任选其一。
1、现金赔付计划
微盟会针对因系统不可用期间商家边际贡献利润额进行赔付,具体公式计算如下:
边际贡献利润额=日均收入×行业平均边际贡献利润率×系统故障时间
其中,日均收入等于该商家在2020年2月17日晚7点至2020年2月23日晚7点在微盟系统中产生的实际成交额除税后的平均值;边际贡献利润率是指在收入(不含税)基础上扣除商品成本、仓储及物流费及推广费、销售佣金等与商品服务销售及交付过程直接相关的费用之后的边际贡献利润占收入的比例;行业边际贡献利润率最终参考值将以研究机构公开报告为准;系统故障时间自2月23日晚7点至3月3日上午9点。
2、流量赔付计划
微盟会针对因系统不可用期间的商家给予腾讯广告50000曝光次数进行流量补偿,并且提供账户运营服务,同时再延长SaaS服务有效期两个月。
其中,腾讯广告包括微信朋友圈广告、微信公众号广告、小程序广告等;曝光次数是指该广告被用户看到的次数;运营服务包含广告的创意策划、素材制作、投放执行、数据分析、账户优化、数据报表等运营服务。
在接下来一个月左右时间里,微盟将开发完成线上赔付系统,届时商家可通过登录微盟商户后台,点击申请赔付即可完成。
四、数据安全保障计划
事故发生后,微盟内部在系统自查的同时,邀请外部数据安全专家一起来评估数据安全保障方案。
具体如下:
措施一:数据安全管理机制全面加固与整改,加强运维平台治理
1、完善数据安全管理制度(涵盖权限、监控、审计方面),严格执行授权审批制度;
2、使用腾讯云CAM权限系统进行云资源管理,严格执行分级授权和最小集权限制度,对高危险动作执行二次授权制度;
3、建立科学、高效、安全的网络策略,对开发环境、测试环境和生产环境进行严格隔离;使用腾讯云堡垒机替换自建堡垒机,进行细粒度权限分级和授权管理,同时严格审计堡垒机操作日志,发送安全审计报表;
4、加强运维安全流程学习,职业道德学习,法律学习等。
措施二:加强灾备体系的建设,做到多云异地冷备
1、建立多云灾备体系,在北京、上海、南京等地区建立全备份的冷备系统架构;
2、借助腾讯云的IAAS的底层服务能力,建立高可用的同城双活架构;
3、云上所有的云主机,启用每天的快照策略,保证全量和增量备份;
4、所有非结构化数据,使用腾讯COS对象存储系统进行归档保存,启用COS的多异地复制功能,数据存放多地,并且COS 冷存储,确保数据只增不减;
5、建立月、季度级别的定期演练机制和制度。
措施三:基础设施全力上云
1、借助腾讯云数据库MySQL的数据高可用和安全体系,逐步放弃自建数据库服务 ,迁移到腾讯云数据库(CDB),快速具备数据库跨可用区和异地灾备的能力;
2、黑石1.0物理机全面升级黑石2.0,全面使用云主机。