买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于最大权重匹配的差分隐私合成数据发布方法_南京航空航天大学_202310060144.5 

申请/专利权人:南京航空航天大学

申请日:2023-01-15

公开(公告)日:2023-05-26

公开(公告)号:CN116167078A

主分类号:G06F21/62

分类号:G06F21/62;G06F18/22;G06F18/2411;G06F18/20;G06F18/15;G06F18/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.06.13#实质审查的生效;2023.05.26#公开

摘要:本发明公开了一种基于最大权重匹配的差分隐私合成数据发布方法,所述方法首先是通过可靠的第三方服务器将收集到的用户数据进行预处理;然后将处理后的数据属性使用图模型的方法进行信息表示,得到一个属性关联图;接着根据最大权重匹配算法选出一组合适的低维边际集合;随后分别对这组低维边际添加噪声,该噪声满足差分隐私定义;再对加噪后的低维边际集合进行后处理,得到一组标准化的低维边际集合;根据这组低维边际集合进行数据合成,使得合成数据集与原始数据集在统计信息上尽可能相似,最后,将合成数据集进行数据发布。采用上述技术方法,能够在保证合成数据集效用的同时,降低计算复杂度,对于高维数据有更好的效用。

主权项:1.一种基于最大权重匹配的差分隐私合成数据发布方法,其特征在于,所述方法通过对原始数据集构建的概率图模型应用最大权重匹配算法得到低维边际集合,对低维分布基于差分隐私方法添加合适的噪声后,经过后处理进行数据合成,之后发布合成数据集,由此实现对用户信息的隐私保护,并提高合成数据集的效用;所述方法包括如下处理步骤:S1、服务器将收集得到的用户数据进行聚合,得到初始数据集,根据数据集构建带权重的概率图模型;S2、服务器根据生成的概率图模型,应用最大权重匹配算法,得到一组高相关性的低维边际集合;S3、根据差分隐私模型的定义,以及隐私预算的合理分配方法,对低维边际集合添加合适的高斯噪声;S4、对于添加噪声后出现的概率数据出现负数以及数据不一致问题进行处理;S5、使用经过添加噪声处理以及后处理的低维边际集合,合成高维数据集,以在统计信息上近似原始数据集,最后由服务器发布合成数据集。

全文数据:

权利要求:

百度查询: 南京航空航天大学 基于最大权重匹配的差分隐私合成数据发布方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。