首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于聚类的差分隐私用电采集数据隐私保护方法及装置_国电南瑞南京控制系统有限公司;国电南瑞科技股份有限公司;南瑞集团有限公司_202110871359.6 

申请/专利权人:国电南瑞南京控制系统有限公司;国电南瑞科技股份有限公司;南瑞集团有限公司

申请日:2021-07-30

公开(公告)日:2024-04-30

公开(公告)号:CN113688420B

主分类号:G06F21/62

分类号:G06F21/62;G06F18/2321;G06Q50/06

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.12.10#实质审查的生效;2021.11.23#公开

摘要:本发明公开了一种基于聚类的差分隐私用电采集数据隐私保护方法及装置,包括:利用差分隐私技术把拉普拉斯噪音添加到用电采集数据中抵御相关攻击;根据聚类分析的结果对噪音值的最大值进行了限制。本发明利用差分隐私技术保护采集到的用电采集数据,保证数据的可用性;为了进一步提高用电采集数据的可用性,限制添加到用电采集数据中的噪音最大值。

主权项:1.一种基于聚类的差分隐私用电采集数据隐私保护方法,其特征在于,包括以下过程:对用电采集数据及其相邻数据分别进行数据聚类,得到对应的类簇;基于用电采集数据及其相邻数据的类簇数据,计算得到拉普拉斯噪音的概率密度函数;基于用电采集数据的类簇数据,计算得到噪音值限制的最大值;基于噪音的概率密度函数和噪音值限制的最大值,计算得到用电采集数各属性的噪音值;将各属性的噪音值添加到用电采集数据的类簇中;所述基于用电采集数据及其相邻数据的类簇数据,计算得到拉普拉斯噪音的概率密度函数,包括:拉普拉斯分布下的噪音的概率密度函数表达式如下所示: 其中,pr表示概率密度,r表示噪音变量,λ为拉普拉斯分布的参数,e表示自然常数;λ由差分隐私参数和全局敏感度决定,其值为全局敏感度Δf和差分隐私参数ε的商;计算聚类分析中的第i属性的全局敏感度Δf: 其中,Δf表示用电采集数据库的某个类簇第i属性的全局敏感度,nc和n'c分别表示两个类簇的数据记录的数量,表示类簇中第j条数据记录的第i个属性,表示相邻类簇中第j′条数据记录的第i个属性;由于用电采集数据D和相邻数据D'仅相差一条用电采集数据记录,假设nc=1+n'c,那么公式3变换为如下公式: 由于D'和D仅相差一条用电采集数据记录,那么为用电采集数据D中第i个属性最大的值,该值简记为那么公式4变换为如下公式: 将公式5计算得出的全局敏感度代入到公式2,得到添加到用电采集数据中的拉普拉斯噪音的概率密度函数为: 其中,p表示概率密度,nc表示数据记录的数量,ε表示差分隐私参数,cx′i表示类簇中的中心点坐标。

全文数据:

权利要求:

百度查询: 国电南瑞南京控制系统有限公司;国电南瑞科技股份有限公司;南瑞集团有限公司 一种基于聚类的差分隐私用电采集数据隐私保护方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。