北京百度网讯科技有限公司刘伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利网站识别方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113204695B 。
龙图腾网通过国家知识产权局官网在2023-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110519373.X,技术领域涉及:G06F16/951;该发明授权网站识别方法和装置是由刘伟;陈由之;余文利;王鹏;杨国强;张博;林赛群设计研发完成,并于2021-05-12向国家知识产权局提交的专利申请。
本网站识别方法和装置在说明书摘要公布了:本公开公开了网站识别方法和装置,涉及计算机技术领域,具体涉及网站安全技术领域。具体实现方案为:首先从站群网络中确定待识别网站,然后基于站群网络中的引流关系网对网站数据进行采样,获取到待识别网站的采样数据,并将获取到的采样数据输入质量识别模型中,得到待识别网站的质量标签,最后基于站群网络中每个网站的质量标签,筛选并关联低质标签对应的网站,得到低质网站识别结果,能够依赖网站之间的导流关系网,识别出低质标签对应的网站,确定出与低质网站关联的其他网站,能够从数据生产源头控制黑灰产业,提高了黑灰产业识别的准确性、及时性和全面性。
本发明授权网站识别方法和装置在权利要求书中公布了:1.一种网站识别方法,包括:从站群网络中确定待识别网站,其中,所述站群网络包括多个网站和多个网站之间的引流关系网;基于所述引流关系网获取所述待识别网站的采样数据,并将所述采样数据输入质量识别模型中,得到所述待识别网站的质量标签,其中,所述质量识别模型用于表征待识别网站的采样数据与质量标签的对应关系,所述质量标签包括低质标签;基于所述站群网络中每个网站的质量标签,筛选并关联所述低质标签对应的网站,得到低质网站识别结果;所述基于所述引流关系网获取所述待识别网站的采样数据,包括:基于所述引流关系网,确定与所述待识别网站关联的多个网站;对所述多个网站的网站数据进行数据采样,得到所述待识别网站的采样数据;其中,对所述多个网站的网站数据进行数据采样,得到所述待识别网站的采样数据,包括以下至少一项:基于所述引流关系网,在所述多个网站中确定头部节点网站和头部节点网站的头部数据,并对所述头部数据进行数据去重,得到所述待识别网站的采样数据;基于所述引流关系网,在所述多个网站中确定长尾数据,并从多个网站的网站数据中删除所述长尾数据,得到所述待识别网站的采样数据;基于所述引流关系网,在所述多个网站的网站数据中执行随机游走,得到所述待识别网站的采样数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。