买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向加密流量的视频资源与视频播放页面的域名关联方法_中国科学院信息工程研究所_202210727746.7 

申请/专利权人:中国科学院信息工程研究所

申请日:2022-06-22

公开(公告)日:2024-04-30

公开(公告)号:CN115209183B

主分类号:H04N21/234

分类号:H04N21/234;H04N21/262;H04N21/266;H04N21/858

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2022.11.25#实质审查的生效;2022.10.18#公开

摘要:本发明公开一种面向加密流量的视频资源与视频播放页面的域名关联方法,属于网络安全领域,基于流量数据利用序列挖掘算法挖掘不同资源间的关联关系,将视频资源与视频播放页面的域名进行关联,通过防范视频播放页面的方式遏制有害视频的传播。本方法主要适用于部署在网关系统中,有助于发现盗版视频的源头,防范有害视频的传播。

主权项:1.一种面向加密流量的视频资源与视频播放页面的域名关联方法,其特征在于,包括以下步骤:1)根据视频资源流量日志构造历史上下文序列,包括针对每一条视频资源流量日志,在仅包含视频资源流量的视频日志数据库中查询其历史出现信息,判断出现次数是否满足序列挖掘的最少次数要求;若满足,则对过去出现的每一条视频资源流量日志查询包含所有流量数据的历史流量日志数据库,根据设置的窗口大小构建历史上下文序列,并保留序列的先后顺序;2)利用PrefixPair算法进行挖掘,找出视频资源真实播放页面概率最高的频繁序列l,步骤包括:从历史上下文序列数据中找出所有长度为1且符合预设的序列挖掘最小支持度的前缀,构建频繁1项序列;再为每一个频繁1项序列投影其对应的序列数据得到投影序列,计算投影序列中各长度为1的子序列的支持度,如果子序列的支持度和其对应的1项前缀的支持度不相同,则将满足支持度的单项与其在投影序列中的前缀进行合并,得到频繁2项序列及其支持度;将频繁2项序列按照其支持度进行倒序排序,从频繁2项序列首部的频繁1项序列中找出视频资源真实播放页面概率最高的频繁序列l,即首先将频繁2项序列首部的频繁1项序列作为视频资源对应的候选播放页面的域名构建候选列表,然后将候选列表中排名第一的频繁1项序列l作为视频资源真实播放页面概率最高的频繁序列l;3)在PrefixPair算法的基础上加入迭代和递归来构建Multi-PrefixPair算法,利用Multi-PrefixPair算法进行以下处理:将长度为1的频繁序列l作为候选播放页面进一步迭代挖掘,通过前缀投影的方式找到其对应的支持度仅小于前缀且序列长度最长的频繁序列L;将频繁序列L与原始的历史上下文序列进行匹配,对未匹配上的原始的历史上下文序列再次采用PrefixPair算法进行挖掘,如此反复,直到原始的历史上下文序列不符合挖掘条件为止;4)从频繁伴随序列中得到视频资源对应的候选播放页面集合,从序列挖掘返回结果中通过统计排序的方式构建视频资源播放页面候选集,将视频资源域名与播放页面域名进行关联。

全文数据:

权利要求:

百度查询: 中国科学院信息工程研究所 面向加密流量的视频资源与视频播放页面的域名关联方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。