买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】自适应K-Nets聚类的差分隐私保护方法_广西师范大学_202011558895.2 

申请/专利权人:广西师范大学

申请日:2020-12-25

公开(公告)日:2022-04-05

公开(公告)号:CN112560984B

主分类号:G06F21/62(20130101)

分类号:G06F21/62(20130101);G06K9/62(20220101)

优先权:

专利状态码:有效-授权

法律状态:2022.04.05#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要:本发明公开一种自适应K‑Nets聚类的差分隐私保护方法,首先采用计算自然邻居的方式得到所有数据点的自然邻居,当所有数据点的自然邻居总数不变或者自然邻居数为0的个数不变时,得到的K值就是我们所需要的K近邻的参数。随后利用K‑Nets的网络模型,计算数据点的KNN平均距离作为数据点的得分值,为了保护隐私,将得分值添加拉普拉斯噪声进行保护。之后对得分值排序选出密度从高到低的簇,依次判断找出自然形成的M个簇,对没有加入到M簇中的点判断是否是离群点,对不是离群点也没有加入簇中的点,遍历将这些点归入到离它最近的簇中。本发明能够有效保证数据的隐私不被泄露。

主权项:1.自适应K-Nets聚类的差分隐私保护方法,其特征是,包括步骤如下:步骤1、将原始数据集中的各个数据点都作为中心点,令K值从1开始逐渐累加,确定每个数据点的K近邻,并基于每个数据点的K近邻确定每个数据点的自然邻居;当所有数据点的自然邻居总数不变或者自然邻居数为0的个数不变时,取这时的K值作为最合适K值;步骤2、将原始数据集中的各个数据点都作为中心点,令K值为步骤1所确定的最合适K值,确定每个数据点的K近邻;计算每个数据点的得分值,并基于所分配的隐私预算对每个数据点的得分值进行拉普拉斯加噪,得到每个数据点的满足差分隐私得分值;步骤3、对步骤2所得到的数据点的满足差分隐私得分值进行升序排列;步骤4、基于步骤3所确定的顺序,对原始数据集中的所有数据点进行遍历;在遍历过程中,判断当前数据点及其K近邻是否都存在于当前有归属数据点集合中:如果都不存在,则将当前数据点及其K近邻加入到当前有归属数据点集合中,并将当前数据点加入到当前中心点集合中:否则,则处理原始数据集的下一个数据点,直到遍历完原始数据集中的所有数据点;步骤5、完成步骤4之后,有归属数据点集合中存在|M|个数据点及其K近邻所组成的预簇,中心点集合中存在|M|个中心点;步骤6、先将所有预簇的中心点到预簇中各个数据点的最远距离的平均值作为截止距离;再基于截止距离确定每两个预簇的边界区域集合,若这两个预簇中的其中一个预簇的数据点与另一个预簇的数据点之间的距离小于截止距离时,则这两个数据点属于这两个预簇的边界区域集合;后将所有边界区域集合中的数据点的最大局部密度的平均值作为密度阈值;步骤7、将原始数据集中没有加入到有归属数据点集合,且局部密度小于密度阈值的数据点,作为离散点;步骤8、对于每个离散点,从中心点集合的|M|个中心点中找出与该离散点距离最近的中心点,并将该离散点加入到该中心点所属的预簇中,由此生成|M|个最终簇。

全文数据:

权利要求:

百度查询: 广西师范大学 自适应K-Nets聚类的差分隐私保护方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术