买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】信息安全的甄别方法、装置、设备及存储介质_平安科技(深圳)有限公司_201910991165.2 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-10-18

公开(公告)日:2024-03-22

公开(公告)号:CN110909531B

主分类号:G06F40/216

分类号:G06F40/216;G06F40/289;G06F40/30;G06F16/35;G06F16/36

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2021.12.28#实质审查的生效;2020.03.24#公开

摘要:本发明涉及人工智能技术领域,公开了一种信息安全的甄别方法,基于分布式系统构架和内存式计算机引擎搭建爬虫系统从不同的渠道上采集信息,然后利用各种行业中最先机的机器学习和语义定义算法,不断学习信息安全的相关词条,不断扩大获取文本的数据来源,从更全面的领域更深层次的角度对网络安全信息进行分析,构建数据之间的内在关联关系,增加分析结果的有效性和说服力,基于学习到的词条的知识库中的内在关联关系,对网络中传输的信息进行甄别;本发明还提供了一种信息安全的甄别装置、设备及计算机可读存储介质,挖掘网络信息安全知识内在的联系,辅助识别网络业务中存在的欺诈或者漏洞场景,提高网络传输信息的安全性。

主权项:1.一种信息安全的甄别方法,其特征在于,所述信息安全的甄别方法包括以下步骤:通过爬虫平台获取各互联网渠道上与网络安全有关的数据信息,其中,所述爬虫平台为基于分布式系统构架和内存式计算机引擎搭建而成,所述数据信息至少包括文本数据和图像数据;根据预设的机器学习算法以及词条的语义定义算法,对所述数据信息进行文本语义或者图像形状轮廓的机器学习,得到机器学习结果;将所述机器学习结果转换成词向量的特征矩阵,并基于所述特征矩阵,建立所述数据信息中不同数据信息之间的内在关联关系,得到信息安全识别库,其中,所述内在关联关系包括文本数据之间的语义关联关系和图像数据之间的形状轮廓关联关系;获取待处理的安全事件,并确定所述安全事件的数据类型,所述安全事件为网络终端通过网络从网络服务器中接收到的网络信息;根据所述数据类型,从所述信息安全识别库选择对应的知识库,并基于所述知识库中文本数据之间的语义关联关系和图像数据之间的形状轮廓关联关系,对所述安全事件进行安全分类和甄别处理;所述通过爬虫平台获取各互联网渠道上与网络安全有关的数据信息包括:获取所述爬虫平台实时监控所述互联网渠道时采集的交互数据;根据随机抽取样本的规则,从监控到的所述交互数据中抽取与网络安全相关的基础数据,并基于所述基础数据形成用于训练所述信息安全识别库的数据样本,其中,所述互联网渠道包括互联网网页和数据存储平台中的至少一种;若抽取的基础数据为文本数据,则根据语义识别技术将所述文本数据分割成若干个词条,形成所述数据信息,其中,所述词条为具有明确语义的单位词句;若抽取的基础数据为图像数据,则根据图像形状最小单元的分割技术将所述图像数据分割成若干个图谱以形成所述数据信息,所述图谱为具有确定的单一形状的完整轮廓的图像碎片;所述根据语义识别技术将所述文本数据分割成若干个词条,形成所述数据信息包括:将所述文本数据分别按照正向分割法和逆向分割法进行划分,得到正向词条集和逆向词条集;计算所述正向词条集和逆向词条集中每个词条的绝对频率和相对频率;比较所述正向词条集的绝对频率和所述逆向词条集的绝对频率,以及比较所述正向词条集的相对频率和所述逆向词条集的相对频率,得到所述绝对频率和相对频率的比较结果;计算所述比较结果中所述绝对频率与所述相对频率之间的相差值,并选择所述相差值在预设范围内的任意一个词条集作为所述文本数据的分割集合;判断选定的所述词条集中词条的绝对频率和相对频率是否大于对应的预设统计值;若判断的结果为小于所述预设统计值,则将小于所述预设统计值的词条从所述词条集中剔除,形成最终的数据信息;其中,所述绝对频率的计算方式为:将所述词条出现的次数除以所述文本数据的长度,得到所述词条的绝对频率;所述机器学习算法包括语言学习模型和回归训练模型,在所述根据语义识别技术将所述文本数据分割成若干个词条,形成所述数据信息的步骤中,还包括:获取互联网中对新词条和专有名词的语义定义规则;在所述将所述机器学习结果转换成词向量的特征矩阵,并基于所述特征矩阵,建立所述数据信息中不同数据信息之间的内在关联关系,得到信息安全识别库的步骤之后,还包括:根据语义定义规则和所述语言学习模型,对所述文本数据中的对所述文本数据进行重新分割并学习,形成文本知识库;根据所述回归训练模型和所述文本知识库,对所述信息安全知识库进行回归分析,得到所述文本知识库中满足回归条件的新词条和专有名词,并将其添加到所述信息安全知识库中。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 信息安全的甄别方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。