买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种用于检测钓鱼网址的方法_深圳信息职业技术学院_202110476844.3 

申请/专利权人:深圳信息职业技术学院

申请日:2021-04-29

公开(公告)日:2023-12-08

公开(公告)号:CN113132410B

主分类号:H04L9/40

分类号:H04L9/40;G06F16/906;G06F16/955;G06F40/126;G06N3/0464;G06N3/048;G06N3/045;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.12.08#授权;2021.08.03#实质审查的生效;2021.07.16#公开

摘要:本发明提供一种用于检测钓鱼网址的方法,应用于网址URL字符串,用于判断所述URL字符串指示的网址是否为钓鱼网址,包括:建立基于卷积神经网络与多头自注意网络二者并行结合的深度学习网络钓鱼网址检测分类器模型;使用预先准备的均衡的URL样本集对所述分类器模型进行训练;使用训练后的所述分类器模型对未知性质的URL字符串进行判别,判断其是否为钓鱼网址。由于卷积神经网络和多头自注意网络可以分别学习URL字符串特征及特征权重,并且二者可以并行进行,使得本分类器模型能够有效地节省分析处理时间,并且判断准确性较高,具有应用于互联网大规模网络实时检测的前景。

主权项:1.一种用于检测钓鱼网址的方法,其特征在于,应用于网址URL字符串,用于判断所述URL字符串指示的网址是否为钓鱼网址,具体包括如下步骤:S1:建立基于卷积神经网络与多头自注意网络二者并行结合的深度学习网络钓鱼网址检测分类器模型;S2:采用生成对抗网络来生成钓鱼网址,获得均衡的URL样本集对所述分类器模型进行训练;所述生成对抗网络由生成器G和分类器D组成,生成器G接收噪声来生成模拟数据,分类器D将模拟生成的数据和真实数据区分开来;通过不断地博弈,最终生成器G生成足够多逼真的模拟数据,以至于分类器D无法把它和真实数据区开来;生成器G的训练过程如下:1通过高斯随机分布生成m个数据,并形成数据集Z,其中zi∈Z,i=1,……,m;2输入数据集Z得到GZ,其为97维向量集,对于向量集中的每一个向量,97维中最大的元素置为1,其余置为0,这使得任一个向量均能表示一个URL;3使用真实钓鱼URL样本向量集矩阵X,其中xi∈X,i=1,……,m;4使用X和GZ训练分类器D,并通过提升其随机梯度来更新分类器D: 通过高斯随机分布生成一些噪声数据形成数据集Z,并将数据集Z输入生成器G得到GZ,同时通过提升其随机梯度来更新生成器G: 交替训练分类器D和生成器G,如果分类器D的准确率保持0.5,训练结束,此时分类器D无法区分真实世界的网络钓鱼URL和自动生成的网络钓鱼网址,此时生成器G用来生成网络钓鱼URL;S3:使用训练后的所述分类器模型对未知性质的URL字符串进行判别,判断其是否为钓鱼网址。

全文数据:

权利要求:

百度查询: 深圳信息职业技术学院 一种用于检测钓鱼网址的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。