买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于CLIP的非独立同分布数据联邦学习方法_喀什地区电子信息产业技术研究院_202311631565.5 

申请/专利权人:喀什地区电子信息产业技术研究院

申请日:2023-11-27

公开(公告)日:2024-04-05

公开(公告)号:CN117829267A

主分类号:G06N3/098

分类号:G06N3/098;G06N3/0464;G06N3/0455;G06F18/2415;G06V10/82;G06F18/232

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本发明属于联邦学习技术领域,公开了一种基于CLIP的非独立同分布数据联邦学习方法,适用于服务端和若干与服务端通信连接的客户端之间的模型训练;每个客户端设置有CLIP模型;首先,服务端确定自定义模型和训练任务,将自定义模型和训练参数发送给与之通信连接的全部客户端;每个客户端利用本地训练数据集对自定义模型进行训练,并将训练好的自定义模型上传至服务端;服务端依据来自各客户端的自定义模型进行分类聚合,为每一组生成个性化自定义模型,并分发给相应客户端。本发明针对客户端上传的自定义模型参数进行分组,然后聚合,使得在面对非独立同分布数据时,聚合的模型准确率高。

主权项:1.一种基于CLIP的非独立同分布数据联邦学习方法,其特征在于,适用于服务端和若干与服务端通信连接的客户端之间的模型训练;每个客户端设置有CLIP模型;所述CLIP模型包括图像编码器和文本编码器,以及分别与图像编码器和文本编码器连接的第一映射单元和第二映射单元;所述联邦学习方法具体以下步骤:S1服务端确定自定义模型和训练任务;所述自定义模型为卷积层或全连接层;S2服务端将自定义模型和训练参数发送给与之通信连接的全部客户端;S3每个客户端利用本地训练数据集对自定义模型进行训练;该步骤包括以下分步骤:S31本地训练数据集中图像和文本分别输入CLIP模型的图像编码器和文本编码器,得到第一图像向量和第一文本向量;S32第一映射单元和第二映射单元分别将第一图像向量和第一文本向量映射到一个联合多模态空间,得到第二图像向量和第二文本向量;S33计算第二图像向量和第二文本向量之间的余弦相似度;S34利用余弦相似度对自定义模型进行训练;训练完成后,各客户端将训练好的自定义模型上传至服务端;S4服务端依据来自各客户端的自定义模型进行分类聚合,为每一组生成个性化自定义模型,并分发给相应客户端;该步骤包括以下分步骤:S41计算来自各客户端的自定义模型参数之间的余弦距离;依据余弦距离聚类分组;S42依据分组结果,将各组内的客户端自定义模型参数进行聚合,生成相应组的个性化自定义模型;S43将生成的个性化自定义模型发送给相应的客户端;服务端随机抽取部分客户端,重复上述步骤S3-S4,直至每个客户端测试精度达到预定目标。

全文数据:

权利要求:

百度查询: 喀什地区电子信息产业技术研究院 一种基于CLIP的非独立同分布数据联邦学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。