买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】侦测钓鱼网站的深度学习模型、方法、系统、装置及介质_浪潮卓数大数据产业发展有限公司_202310809304.1 

申请/专利权人:浪潮卓数大数据产业发展有限公司

申请日:2023-07-04

公开(公告)日:2023-10-27

公开(公告)号:CN116955804A

主分类号:G06F16/9535

分类号:G06F16/9535;H04L9/40;G06F16/906;G06N3/0464;G06N3/044;G06N3/084;G06N3/082

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.11.14#实质审查的生效;2023.10.27#公开

摘要:本发明公开了侦测钓鱼网站的深度学习模型、方法、系统、装置及介质,属于大数据处理技术领域,要解决的技术问题为如何精确的侦测钓鱼网站。包括基于CNN算法构建的第一模型和基于BiGRU算法构建的第二模型。包括如下步骤:获取历史网页,并基于网页为钓鱼网站的概率对历史网页进行标注,得到0‑1范围的标签值;基于历史网页以及对应的标签值构建训练集;构建钓鱼网站预测模型,所述钓鱼网站预测模型为如权利要求1所述的深度学习模型;基于训练集对所述钓鱼网站预测模型进行模型训练,得到训练后钓鱼网站预测模型;以待检测的网页为输入,通过训练后钓鱼网站预测模型输出预测结果,基于预测结果判断网页是否为钓鱼网站。

主权项:1.一种侦测钓鱼网站的深度学习模型,其特征在于,包括基于CNN算法构建的第一模型和基于BiGRU算法构建的第二模型;所述第一模型用于执行如下:使用一维卷积运算Conv1D构建一个十六核的卷积网络,使用relu函数作为激活函数,通过激活函数对十六核的卷积网络输出的结果进行第一次过滤;使用批标准化batchnormalization将离散的数据统一,并将统一后的数据传入池化层;在池化层,使用极大池化算法将特征图进行特征选择与信息过滤;使用dropout算法,随机处理一种一半的节点以保证节点的可用性;所述第二模型用于以第一模型的输出为输入,并执行如下:使用门控循环单元GRU构造256单位的双向循环神经网络;对于双向循环神经网络输出的结果,使用dropout算法随机使用其中一半的数据进行计算;将结果拟合,使用relu激活函数得到一个16个单位的特征值集合;使用sigmoid函数平滑特征值集合中十六个结果,输出一个0-1的值,靠近1的表示为钓鱼链接。

全文数据:

权利要求:

百度查询: 浪潮卓数大数据产业发展有限公司 侦测钓鱼网站的深度学习模型、方法、系统、装置及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。