买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于博弈论的联邦学习隐私策略选择方法_之江实验室;广州大学_202110292473.3 

申请/专利权人:之江实验室;广州大学

申请日:2021-03-18

公开(公告)日:2024-03-19

公开(公告)号:CN112926088B

主分类号:G06F21/62

分类号:G06F21/62;G06N20/00;G06N5/04

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2021.06.25#实质审查的生效;2021.06.08#公开

摘要:本发明公开了一种基于博弈论的联邦学习隐私策略选择方法,该方法包括:服务器为参与方提供具有不同服务成本的阈值,参与方根据是否满足服务质量、隐私泄露代价等来选择最佳阈值,并由服务器在下一次迭代训练中更新服务成本;服务器通过多次迭代来获得最优的模型参数,以此保持模型长期稳定的服务状态,并提供给参与方。该方法有效避免了参与方“搭便车”等恶意行为,使得服务器可以最大限度地得到服务费用,参与方可以获得长期的优质服务。

主权项:1.一种基于博弈论的联邦学习隐私策略选择方法,其特征在于,该方法包括:服务器为参与方提供具有不同服务成本的模型质量的权衡参数λMQ与隐私强度的权衡参数λPI的比值λMQλPI,参与方根据是否满足服务质量、隐私泄露代价来选择最佳阈值,并用自身数据集训练模型,并把选择的阈值和训练更新的模型参数发给服务器;服务器收集各个参与方的模型参数进一步训练模型,获得优化的模型参数,并更新服务阈值λMQλPI和服务成本后再发给参与方,以此服务器保持模型长期稳定的服务状态提供给参与方;在每次迭代中,服务器计算各个参与方的效用utilityi,以及所有参与方的效用平均值utility,utility=∑utilityiN;当一位参与方的效用utilityi大于等于总体参与方的效用平均值utility时,下一次迭代时不更改自身策略;否则,下一次迭代时参与方重新选择阈值λMQλPI;当参与方采用低质量的数据训练模型时,得不到奖励,即奖励为0,当参与方采用低质量的数据训练模型时,会得到奖励,奖励如下: 其中,x为演化博弈的迭代次数,b为服务器奖励给参与方的收益,qosρ,r=1-1-ρr为模型全局服务质量贡献度函数,ρ为全局服务质量贡献度,rx为在第x次迭代中选择高质量阈值的参与方数量,rfix为每一轮新训练中过时数据的价值,qosexpect为全局服务质量的期望值,p为隐私泄露发生时的价值损失,pdrσ,r为参与方隐私的贡献函数,σ为参与方隐私贡献度,Z为参与方选择高质量阈值的概率,N为参与方总数;服务器通过调节奖励的预算b,使得整个演化博弈模型最终稳定在一个概率Z;该概率Z是指在训练更新模型的过程中,寻找到参与方选择高质量阈值的概率,来保证模型的长期服务质量;通过多轮迭代,最终整个服务训练的参与者有Z的概率选择高质量数据训练模型,1-Z的概率选择低质量数据训练模型,Z的计算方法如下:Z=utilityutilityi。

全文数据:

权利要求:

百度查询: 之江实验室;广州大学 一种基于博弈论的联邦学习隐私策略选择方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。