买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于本地差分隐私的效用优化集合数据保护方法_南京航空航天大学_202210618868.2 

申请/专利权人:南京航空航天大学

申请日:2022-06-01

公开(公告)日:2024-04-12

公开(公告)号:CN115130119B

主分类号:G06F21/60

分类号:G06F21/60;G06F21/62;G06F21/64

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2022.10.25#实质审查的生效;2022.09.30#公开

摘要:本发明公开了一种基于本地差分隐私的效用优化集合数据保护方法,属于信息安全领域。该方法包括服务器将原始数据域划分为敏感数据域和非敏感数据域,并将划分结果,隐私预算和数据条数公开;用户对自己的集合数据进行采样或填充,然后根据数据所属类别,在本地对其进行扰动,并将结果发送给服务器。服务器收集用户的扰动后数据,分析计算出原始数据的频率估计结果。本发明可以抵抗具有任意背景知识的攻击者和防止来自不可信第三方服务器的隐私攻击;本发明可以在保证敏感数据保护力度不降低的前提下,提高整体数据效用,进而提高服务器统计结果的准确度。

主权项:1.一种基于本地差分隐私的效用优化集合数据保护方法,其特征在于:包括以下步骤:S1、服务器将原始数据域X划分为敏感数据域XS和非敏感数据域XN,且确定用户数据指定条数m,虚假数据域XT和所使用的隐私预算ε,并把XS,XN,XT,m和ε公开给用户;S2、用户对自己的数据进行预处理,若数据条数大于m,则从中随机抽取m条,若数据条数小于m,则使用虚假数据补齐到m条,虚假数据由用户自己从XT选择,虚假数据也属于非敏感数据;s'表示用户预处理后的数据,s'={x1,x2,…,xm},X'表示全体数据域,X'=X∩XT;S3、用户根据s'中数据所属类别进行扰动,并把扰动后的数据和扰动中使用的哈希函数发送给服务器;其中,用户端原始数据的扰动包括如下过程:S31、由用户自己选择哈希函数h:X→[0.0,1.0,哈希函数h的输入域为全体数据域X',输出域为[0.0,1.0,然后对s'中每一条数据进行哈希,得到哈希后的数据v={hx1,hx2,…,hxm}={v1,v2,…,vm};S32、计算覆盖长度正则化因子Ω=mpeε+1-mp,覆盖区域Cv={t|t∈[vi,vi+p或[0,vi+p-1,i∈[1,m]}和覆盖区域的总长度l,然后按照如下所示的概率密度计算得到扰动结果y0: S33、令针对s'中每一条数据xi,若xi∈s'N,且则将xi加入集合y1中;S34、将h,y0和y1发送给服务器;S4、服务器根据用户发送的扰动后数据和扰动中使用的哈希函数进行统计分析,估算出原始数据的频率分布结果;该步骤中,服务器估算频率分布结果包括如下步骤:S41、服务器收集到全部n个参与者发送的扰动结果,将结果分为两组,第一组是所有用户发来的y0和h,第二组是所有用户发来的y1;S42、计算覆盖长度正则化因子Ω=mpeε+1-mp,正确覆盖概率错误覆盖概率Pf=p;S43:针对XS中每条数据x,令Fx=0,遍历所有用户发来的y0和h,若y0-phx≤y0或y0-p+1hx1,则Fx=Fx+1;其中,原始数据中x的估计频率计算方式如下: S44、针对XN中每条数据x,令Fx=0,遍历所有用户发来的y1,若x∈y1,则Fx=Fx+1;其中,原始数据中x的估计频率计算方式如下:

全文数据:

权利要求:

百度查询: 南京航空航天大学 一种基于本地差分隐私的效用优化集合数据保护方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。