买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于敏感属性值约束的匿名保护方法_西安电子科技大学_202210267491.0 

申请/专利权人:西安电子科技大学

申请日:2022-03-18

公开(公告)日:2024-03-29

公开(公告)号:CN114817977B

主分类号:G06F21/62

分类号:G06F21/62;G06F18/2321;H04L9/40

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2022.08.16#实质审查的生效;2022.07.29#公开

摘要:本发明提供了一种基于敏感属性值约束的匿名保护方法,以期解决现有基于聚类的匿名化技术造成的数据信息损失问题,在有效保护用户隐私安全的情况下降低发布数据的信息损失。利用本发明的匿名保护方法得到匿名数据集之后,再通过网络发布匿名数据集,具有更好的用户隐私保护效果。在实际应用中,可利用数据采集模块,获取原始数据集;并将原始数据集存储于数据存储模块一,以数据处理模块运行本发明的匿名保护方法得到匿名数据集,并将其存储于数据存储模块二,利用网络传输模块向网络上传匿名数据集。原始数据集保存于本地的数据存储模块一,并不对外公开。

主权项:1.一种基于敏感属性值约束的匿名保护方法,其特征在于,包括如下步骤:步骤1,对待发布的网络用户原始数据集D={X1,X2,X3,...,XN}进行聚类,获取m个初始聚类中心点U={μ1,μ2,...,μm},根据语义相似程度划分敏感属性类别,并计算每个敏感属性类别的α约束阈值初始化原始数据集D的簇集合E={C1,C2,...,Cm}为其中N为原始数据集D的数据个数,m为原始数据集D的簇个数;步骤2,从U依次选取一个聚类中心μi;如果执行步骤3;如果执行步骤5;步骤3,从数据集D中找到离μi最近的数据Xi;如果μi的敏感属性值和Xi的敏感属性值不同,并且簇Ci中的敏感属性值种类数小于l,则将Xi归入簇Ci中,并从原始数据集D中删除Xi,更新Ci和D得到Ci′和D′:Ci′←Ci∪{Xi},D←D-{Xi},v表示更新符号;l是约束的同一个簇中敏感属性值的种类个数;如果μi的敏感属性值和Xi的敏感属性值相同,执行步骤4;步骤4,如果簇Ci′的敏感属性值种类小于l,且未遍历完D,则执行步骤3;否则,更新U得到U′:U′←U-{μi},执行步骤2;步骤5,初始化集合步骤6,从D′剩余数据中选取一个数据Xj,计算Xj到每个簇的距离,找到离Xj最近的簇Cj:如果Xj满足如下条件a或b,则将Xj归入簇Cj中,并从D′中删除Xj;如果Xj不满足条件a或b,则继续寻找离Xj最近的下一个簇Ct,判断是否满足条件a或b,直至找到一个满足条件a或b的簇,将数据Xj放入该簇中;如果遍历完所有簇均不满足条件a或b,则将Xj加入集合R中,执行步骤7;条件a:Cj中的所有敏感属性值均与Xj的敏感属性值不同,且|Cj|<k;条件b:Cj中的某一敏感属性值与Xj的敏感属性值相同,且|Cj|<k和其中,k是约束的每个簇中的数据个数,|Cj|表示簇Cj中现有的数据个数;步骤7,判断D′是否为如果为执行步骤8;如果不为执行步骤6;步骤8,判断集合R中是否含有数据:如果有,将剩余数据按信息损失最小加入到数据个数小于k的簇中,并将该数据从集合R中删去,继续执行步骤8;如果没有,执行步骤9;步骤9,判断形成的簇是否满足k,l,α约束,调整簇大小;步骤10,对每个簇中的数据进行局部泛化处理,形成匿名数据集D*。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于敏感属性值约束的匿名保护方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。