查看原文
其他

中国信通院联合发布《数据清洗、去标识化、匿名化业务规程(试行)》

中国信通院 中国信通院CAICT 2024-01-02

数据成为了经济社会数字化、网络化、智能化发展的关键生产要素。开展数据清洗、去标识化、匿名化处理,是为满足数据处理目的对原始数据逐步深入加工改造的过程,是提升数据可用性和安全性的关键数据处理活动。规范数据清洗、去标识化、匿名化处理活动,是推动数据要素强化优质供给,建立合规高效、场内外结合的数据要素流通和交易制度的重要内容。


为规范数据处理行为,激活数据要素市场,北京市经济和信息化局指导中国信息通信研究院产业与规划研究所、北京国际大数据交易所联合编制、发布国内首个系统梳理数据清洗、去标识化、匿名化处理相关流程方法的技术分析报告——《数据清洗、去标识化、匿名化业务规程(试行)》,以期为行业主体开展相关数据处理活动和相应测试评估提供参考,支撑数据共享、交易、开放等流通活动合规、有序进行。



《数据清洗、去标识化、匿名化业务规程(试行)》在《个人信息保护法》《数据安全法》《北京市数字经济促进条例》《北京市数字经济全产业链开放发展行动方案》等法规政策框架下,积极借鉴国家和行业相关标准规范,吸收域外国家和地区相关操作指南经验,体系性地明晰了数据清洗、去标识化、匿名化处理的技术特点、相互关系和落地方式,总结了各项处理活动的目的、流程、技术方法及环境要求。报告中所描述的相关技术方法和应用场景仍在不断演进和变化,本报告将持续跟踪观察,根据工作实践情况不断更新、补充、调整和校正。


报告核心观点

1. 规范数据清洗、去标识化、匿名化处理旨在推动数据要素强化优质供给

规范数据清洗、去标识化、匿名化处理,有助于提升数据的可用、可信、可流通、可追溯水平,推动数据要素强化优质供给,是建立合规高效、场内外结合的数据要素流通和交易制度的重要内容。具体来说,为满足数据可用性和安全性进行的数据清洗、去标识化、匿名化处理,是数据产品进场上市的条件,也是数据资产登记、交易的前提,更是数据应用、建模释放二次衍生价值的底线。


2. 数据清洗是数据可用的保障

数据清洗旨在满足数据的可用性要求,实现数据的规范性、准确性、完整性、一致性、可溯源性的目标,是数据资源预处理的第一步,也是保证后续处理结果准确、科学、有效的重要一环。数据清洗作为数据后续开发利用的基础,是数据去标识化和匿名化处理的前置步骤。


3. 数据去标识化是数据脱敏的关键

数据去标识化处理强调标识符的“不可识别性”,是强化标识数据安全性的重要保障。数据去标识化与在此之前的标识形成过程分属数据处理的不同阶段及场景。标识形成是产生数据的过程,使得被标识对象据此可以被组织进行有效管理和开发利用。数据去标识化是标识数据产生后的加工处理过程,旨在提升标识信息的安全防护水平。


4. 数据匿名化是去标识化的强化

数据匿名化处理在强调标识符的“不可识别性”基础上,要求标识符同时满足“难以复原性”标准,是数据去标识化的进一步处理。但数据匿名化处理描述的是应用相关技术使标识符难以复原的过程,并非描述数据达到绝对匿名化的状态。


5. 去标识化和匿名化未有严格界分

根据相关技术方法抗重新识别风险的能力大小和对敏感内容安全防护程度的差异,可以将仍保留原始数据个体颗粒度的,纳入去标识化技术方法范畴;不再保留原始数据个体颗粒度,或原始数据记录的真实性已受到显著减损,或原始数据记录不对外披露的,纳入匿名化技术方法范畴。当然二者当前没有严格界分,核心都是通过技术手段对标识信息进行脱敏处理,实践中两类技术通常可以组合使用实现预期处理效果。


6. 产业应用需要强调安全性和可用性的平衡

数据清洗、去标识化、匿名化处理要遵循平衡效用原则,在确保安全的前提下,强调数据质量要求,尽可能满足预期效用,促进数据安全性和可用性的有效平衡。同时数据清洗、去标识化、匿名化处理相关技术方法仍在不断丰富、演进和迭代,相关应用场景也在不断发展变化,需要结合业务场景和内外部要求,统筹组合形成平衡安全要求和应用目的的有效技术方案。


报告目录

一、处理目标及相互关系 

(一)数据清洗是数据可用的保障  

(二)去标识化是数据脱敏的关键  

(三)匿名化是去标识化的强化 


二、数据处理原则 

(一)合法合规

(二)安全优先

(三)平衡效用

(四)技管结合

(五)有效溯源


三、数据清洗规程 

(一)处理目的

(二)处理流程

(三)常见技术方法  


四、数据去标识化规程

(一)处理目的

(二)处理流程

(三)常见技术方法  


五、数据匿名化规程  

(一)处理目的

(二)处理流程

(三)常见技术方法  


六、数据处理环境要求

(一)管理制度要求  

(二)技术能力要求  

(三)人员能力要求  

(四)过程控制要求

(五)事故管理要求



版权声明:本报告版权属于中国信息通信研究院、北京国际大数据交易有限公司,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院、北京国际大数据交易有限公司”。违反上述声明者,编者将追究其相关法律责任。



点击“阅读原文”,下载报告。






校  审 | 谨  言、珊  珊

编  辑 | 凌  霄


推荐阅读

中国信通院发布《互联网域名产业报告(2023年)》
专家谈



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存