【发明公布】大数据脱敏方法_中国农业银行股份有限公司上海市分行_202010675130.0 

申请/专利权人:中国农业银行股份有限公司上海市分行

申请日:2020-07-14

发明/设计人:臧其事;赵可欣;吴晓峰

公开(公告)日:2020-10-23

代理机构:上海专利商标事务所有限公司

公开(公告)号:CN111814187A

代理人:陆嘉

主分类号:G06F21/62(20130101)

地址:200120 上海市浦东新区银城路9号

分类号:G06F21/62(20130101);G06Q40/02(20120101);G06F7/58(20060101);G06F17/16(20060101)

优先权:

专利状态码:在审-公开

法律状态:2020.10.23#公开

摘要:本发明揭示了一种大数据脱敏方法,对多维度事实表中的指定数据进行脱敏,包括:初始化步骤,读取多维度事实表中的指定数据并排列为一个数据矩阵,数据矩阵中的每一列对应一个维度,该数据矩阵为原始数据矩阵。空间变换步骤,按照列对每一个维度的指定数据进行变换,变换包括拉伸变换、收缩变换或者扭曲变换,得到经变换的数据矩阵。其中,经归一化处理后,经变换的数据矩阵中的各个数据的值与原始数据矩阵中的对应数值的差异小于5%。本发明的大数据脱敏方法利用空间变换对敏感数据进行脱敏,脱敏后的数据的空间相对位置信息保留,空间变换造成的数据损失小于5%。该大数据脱敏方法也可以应用于分布式框架,以满足分布式系统大数据运算的需求。

主权项:1.一种大数据脱敏方法,其特征在于,对多维度事实表中的指定数据进行脱敏,包括:初始化步骤,读取多维度事实表中的指定数据并排列为一个数据矩阵,数据矩阵中的每一列对应一个维度,该数据矩阵为原始数据矩阵;空间变换步骤,按照列对每一个维度的指定数据进行变换,所述变换包括拉伸变换、收缩变换或者扭曲变换,得到经变换的数据矩阵;其中,经归一化处理后,经变换的数据矩阵中的各个数据的值与原始数据矩阵中的对应数值的差异小于5%。

全文数据:

权利要求:

百度查询: 中国农业银行股份有限公司上海市分行 大数据脱敏方法