买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于大模型的智能数据敏感性检测方法及系统_杭州市滨江区浙工大网络空间安全创新研究院;新疆屏翰网络和数据安全产业创新研究院有限公司_202410002073.8 

申请/专利权人:杭州市滨江区浙工大网络空间安全创新研究院;新疆屏翰网络和数据安全产业创新研究院有限公司

申请日:2024-01-02

公开(公告)日:2024-04-05

公开(公告)号:CN117828667A

主分类号:G06F21/62

分类号:G06F21/62;G06F18/241;G06F18/2415;G06N3/0455

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本发明公开了一种基于大模型的智能数据敏感性检测方法及系统,属于敏感信息检测技术领域。本发明在对文本数据进行初步评估后,根据不同识别难度确立实施分阶段的敏感数据识别,将整个敏感数据识别流程划分为两个独立但相互关联的阶段,通过调节难样本阈值来约束两个阶段识别的不同数据分布,旨在数据交互中实现敏感信息的实时分类和检测。本发明技术通过整合领先的大模型算法,精确分析不同复杂性的文本数据,从而增强数据安全性,有助于在数字环境下实时对文本数据进行深层次的敏感信息挖掘,有效应对数字化时代普遍的安全风险,增强数据交换的安全保障。

主权项:1.一种基于大模型的智能数据敏感性检测方法,其特征在于,包括以下步骤:实时获取数据传输交换过程中流入的文本数据;将所述文本数据输入CBE-BERT模型进行难分类样本划分,得到多个难分类样本集合;采用加权投票机制处理所述难分类样本集合,并根据划分阈值,确定最终难分类样本集合;排除所述最终难分类样本集合中的难分类样本得到易分类样本,采用多层感知机作为所述易分类样本的分类器,获得第一阶段敏感分类结果;构建大模型并设计提示词,将所述提示词与所述最终难分类样本集合中的难分类样本作为输入序列输入所述大模型,输出第二阶段的敏感性得分和置信度;以所述第二阶段的敏感性得分和置信度为判别依据,得到第二阶段敏感分类结果;根据所述第一阶段敏感分类结果和所述第二阶段敏感分类结果得到最优敏感性识别结果。

全文数据:

权利要求:

百度查询: 杭州市滨江区浙工大网络空间安全创新研究院;新疆屏翰网络和数据安全产业创新研究院有限公司 一种基于大模型的智能数据敏感性检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。