买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于机器学习的WAF拦截页面识别的方法、装置及相关组件_北京知其安科技有限公司_202310005406.8 

申请/专利权人:北京知其安科技有限公司

申请日:2023-01-04

公开(公告)日:2023-03-21

公开(公告)号:CN115695054B

主分类号:H04L9/40

分类号:H04L9/40;G06F40/279;G06F18/23213;G06F18/214;G06F18/2411;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2023.03.21#授权;2023.02.21#实质审查的生效;2023.02.03#公开

摘要:本发明公开了一种基于机器学习的WAF拦截页面识别的方法、装置及相关组件,涉及网络安全的领域。该方法包括获取目标攻击响应数据集;对目标攻击响应数据集中所有的样本攻击响应数据进行标签分类,得到不同类别的样本攻击响应数据,并将不同类别的样本攻击响应数据分别组成对应的类别组合,其中一个类别组合由标签为已拦截的目标样本攻击响应数据组成;对已拦截的目标样本攻击响应数据进行特征提取,得到多个特征向量;利用所有特征向量对预搭建的WAF拦截页面识别模型进行训练,构建得到WAF拦截页面识别模型;接收目标攻击响应数据,利用WAF拦截页面识别模型对目标攻击响应数据进行分类,输出分类结果。该方法可以有效提高WAF拦截判断的精准度。

主权项:1.一种基于机器学习的WAF拦截页面识别的方法,其特征在于,包括:获取目标攻击响应数据集;对所述目标攻击响应数据集中所有的样本攻击响应数据进行标签分类,得到不同类别的样本攻击响应数据,并将不同类别的样本攻击响应数据分别组成对应的类别组合,其中一个所述类别组合由标签为已拦截的目标样本攻击响应数据组成;对所述已拦截的目标样本攻击响应数据进行特征提取,得到多个特征向量;利用所有特征向量对预搭建的WAF拦截页面识别模型进行训练,构建得到WAF拦截页面识别模型;接收目标攻击响应数据,利用所述WAF拦截页面识别模型对所述目标攻击响应数据进行分类,输出分类结果;所述对所述目标攻击响应数据集中所有的样本攻击响应数据进行标签分类,得到不同类别的样本攻击响应数据,包括:获取所述目标攻击响应数据集中所有的样本攻击响应数据中的三元组信息,其中,所述三元组信息包括Status_code信息、Headers信息、Body信息;对所述Headers信息按照键的字母序进行排序和进行关键字过滤,构建得到三元组信息;基于预设的标签分类规则和三元组信息,对所有的样本攻击响应数据进行标签分类,得到已拦截的目标样本攻击响应数据;其中,所述利用所有特征向量对预搭建的WAF拦截页面识别模型进行训练,构建得到WAF拦截页面识别模型,包括:获取并初始化所有所述类别组合,随机选择每个类别组合的k个初始聚类中心,初始迭代次数为0;分别计算类别组合中的每个样本到k个初始聚类中心的距离,并将对应的样本分类到与其距离最小的初始聚类中心所对应的类别组合中;其中,针对每一样本攻击响应数据的三元组信息,计算距离的方式包括:针对Status_code信息计算是否相等,相等则确定距离为1,否则距离为0;针对Headers信息计算文本相似度,并将计算结果作为距离;针对Body信息计算文本特征向量的距离;根据类别组合的重新划分,重新计算每个类别组合的聚类中心;判断当前迭代次数是否大于最大迭代次数,若不是,则当前迭代次数加一,并重复计算每个类别组合的聚类中心;若是,则将最后一次迭代后所输出的聚类中心作为最终聚类中心;基于所述最终聚类中心,获取对应的分类结果。

全文数据:

权利要求:

百度查询: 北京知其安科技有限公司 基于机器学习的WAF拦截页面识别的方法、装置及相关组件

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。