买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】钓鱼网站攻击检测方法、装置、电子设备及存储介质_北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司_202210553089.9 

申请/专利权人:北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司

申请日:2022-05-20

公开(公告)日:2024-03-19

公开(公告)号:CN115001763B

主分类号:H04L9/40

分类号:H04L9/40;H04L67/02;G06F18/2431

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2022.09.20#实质审查的生效;2022.09.02#公开

摘要:本公开实施例公开了一种钓鱼网站攻击检测方法、装置、电子设备及存储介质。其中,钓鱼网站攻击检测方法,包括:获取URL数据信息;在所述URL数据信息中分别提取URL数据、网页内容数据及第三方信息数据;基于所述URL数据、网页内容数据及第三方信息数据进行特征提取,得到提取特征;基于所述提取特征得到算法扰动特征;将所述提取特征与算法扰动特征进行融合,得到特征数据集;基于所述特征数据集和机器学习检测引擎检测出钓鱼网站URL。增加了特征的表征能力,从而能够全面的表征出钓鱼网站,避免钓鱼网站绕过检测,达到检测全面的目的。

主权项:1.一种钓鱼网站攻击检测方法,其特征在于,包括:获取URL数据信息;在所述URL数据信息中分别提取URL数据、网页内容数据及第三方信息数据;基于所述URL数据、网页内容数据及第三方信息数据进行特征提取,得到提取特征,所述提取特征,包括:URL特征、第三方信息特征和网页特征;所述URL特征,包括:IP地址特征、URL长度特征、缩短服务特征、四个功能符合特征、HTTPS连接特征、端口号特征和HTTPS令牌特征;所述第三方信息特征,包括:域名到期时间特征、域名年龄特征、域名记录特征、域名访问量特征、页面排名特征、访问特征、URL统计特征和URL身份特征;所述网页特征,包括:图标特征、请求URL特征、锚点链接特征、其他锚点链接特征、服务器表单特征、邮箱特征、重定向特征、触发特征、弹窗特征、设定响应特征、内联框架Iframe特征和指向网页特征;基于所述提取特征得到算法扰动特征;将所述提取特征与算法扰动特征进行融合,得到特征数据集;基于所述特征数据集和机器学习检测引擎检测出钓鱼网站URL;基于所述提取特征得到算法扰动特征,包括:基于所述URL特征、第三方信息特征和网页特征,使用Stacking策略中的GBDT算法、XGBoost算法及LightGBM算法分别计算出3个算法扰动特征;将所述提取特征与算法扰动特征进行融合,得到特征数据集,包括:将所述URL特征、第三方信息特征和网页特征中共33个特征,分别与3个算法扰动特征进行融合,得到33个新的特征集合,所述33个新的特征集合形成特征数据集;所述机器学习检测引擎通过模型训练得到;所述模型训练包括:获取钓鱼网站URL得到钓鱼网站URL样本;在沙箱内运行钓鱼网站URL样本得到钓鱼网站的URL样本数据;基于获取的正常网站URL数据得到正常网站URL样本数据;对所述钓鱼网站的URL样本数据和正常网站URL样本数据进行特征提取,得到训练特征;将所述训练特征经Stacking策略处理得到训练算法特征;基于所述训练算法特征得到训练特征数据集;对所述训练特征数据集进行随机森林算法处理得到钓鱼网站检测分类器。

全文数据:

权利要求:

百度查询: 北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司 钓鱼网站攻击检测方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。