申请/专利权人:浪潮卓数大数据产业发展有限公司
申请日:2023-07-04
公开(公告)日:2023-10-27
公开(公告)号:CN116955804A
主分类号:G06F16/9535
分类号:G06F16/9535;H04L9/40;G06F16/906;G06N3/0464;G06N3/044;G06N3/084;G06N3/082
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.11.14#实质审查的生效;2023.10.27#公开
摘要:本发明公开了侦测钓鱼网站的深度学习模型、方法、系统、装置及介质,属于大数据处理技术领域,要解决的技术问题为如何精确的侦测钓鱼网站。包括基于CNN算法构建的第一模型和基于BiGRU算法构建的第二模型。包括如下步骤:获取历史网页,并基于网页为钓鱼网站的概率对历史网页进行标注,得到0‑1范围的标签值;基于历史网页以及对应的标签值构建训练集;构建钓鱼网站预测模型,所述钓鱼网站预测模型为如权利要求1所述的深度学习模型;基于训练集对所述钓鱼网站预测模型进行模型训练,得到训练后钓鱼网站预测模型;以待检测的网页为输入,通过训练后钓鱼网站预测模型输出预测结果,基于预测结果判断网页是否为钓鱼网站。
主权项:1.一种侦测钓鱼网站的深度学习模型,其特征在于,包括基于CNN算法构建的第一模型和基于BiGRU算法构建的第二模型;所述第一模型用于执行如下:使用一维卷积运算Conv1D构建一个十六核的卷积网络,使用relu函数作为激活函数,通过激活函数对十六核的卷积网络输出的结果进行第一次过滤;使用批标准化batchnormalization将离散的数据统一,并将统一后的数据传入池化层;在池化层,使用极大池化算法将特征图进行特征选择与信息过滤;使用dropout算法,随机处理一种一半的节点以保证节点的可用性;所述第二模型用于以第一模型的输出为输入,并执行如下:使用门控循环单元GRU构造256单位的双向循环神经网络;对于双向循环神经网络输出的结果,使用dropout算法随机使用其中一半的数据进行计算;将结果拟合,使用relu激活函数得到一个16个单位的特征值集合;使用sigmoid函数平滑特征值集合中十六个结果,输出一个0-1的值,靠近1的表示为钓鱼链接。
全文数据:
权利要求:
百度查询: 浪潮卓数大数据产业发展有限公司 侦测钓鱼网站的深度学习模型、方法、系统、装置及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。