买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于半监督联邦学习的数据泄露预警方法、装置及系统_杭州海康威视数字技术股份有限公司_202310361592.9 

申请/专利权人:杭州海康威视数字技术股份有限公司

申请日:2023-04-04

公开(公告)日:2024-03-22

公开(公告)号:CN116108491B

主分类号:G06F21/62

分类号:G06F21/62;G06F21/56;G06F18/23

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2023.05.30#实质审查的生效;2023.05.12#公开

摘要:本申请实施例提供基于半监督联邦学习的数据泄露预警方法、装置及系统。在本实施例中,通过对采集的物联网终端的第一目标数据进行无监督聚类后的数据类别、以及该数据类别下的代表数据作为模型训练数据训练出敏感数据识别模型,不需要各个客户端自己训练模型得到的模型参数,可以避免攻击者恶意放置的设备训练的错误模型参数的影响,提高模型训练精度,进而提高数据泄露预测准确度;同时不同数据采集分析客户端采集的物联网终端的第一目标数据不同,因此利用聚类后的各物联网终端的第一目标数据训练出的敏感数据识别模型可以适配大规模异构物联网终端的多样化数据类型泄露检测。

主权项:1.一种基于半监督联邦学习的数据泄露预警方法,其特征在于,所述方法包括:数据采集分析客户端对采集的物联网终端的第一目标数据进行无监督聚类,得到数据类别、以及该数据类别下的代表数据,并将各数据类别、以及各数据类别下的代表数据进行加密并发送给中心化服务器;所述数据采集分析客户端是在物联网终端新构建的客户端;所述无监督聚类是在第一目标数据中各数据的类别未知的前提下按照特定标准对第一目标数据中的数据进行聚类,以使同一个类别内的数据具有相似性,不同类别内的数据具有差异性;所述第一目标数据至少包括:所述物联网终端的终端信息、所述物联网终端的运行数据、所述物联网终端的业务数据;任一数据类别下的代表数据为代表该数据类别的特征的部分数据;所述中心化服务器基于解密后的来自数据采集分析客户端通过无监督聚类得到的各数据类别、以及各数据类别下的代表数据进行有监督的模型训练,以得到由无监督聚类和有监督模型训练相配合实现的半监督方式下的敏感数据识别模型;所述敏感数据识别模型被用于对物联网终端的当前数据进行识别,并在识别出物联网终端当前存在敏感数据时由所述数据采集分析客户端输出数据泄露预警;所述数据采集分析客户端从所述中心化服务器获得所述敏感数据识别模型的模型参数,利用接收到的模型参数替换已配置的初始神经网络模型的模型参数,基于替换了模型参数的初始神经网络模型进行数据泄露预警;所述初始神经网络模型与所述中心化服务器训练出的敏感数据识别模型的模型结构相同。

全文数据:

权利要求:

百度查询: 杭州海康威视数字技术股份有限公司 基于半监督联邦学习的数据泄露预警方法、装置及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。