买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于对抗生成shapelet的流量异常检测方法及系统_南昌科晨电力试验研究有限公司;国网江西省电力有限公司电力科学研究院_202311695002.2 

申请/专利权人:南昌科晨电力试验研究有限公司;国网江西省电力有限公司电力科学研究院

申请日:2023-12-12

公开(公告)日:2024-04-02

公开(公告)号:CN117407733B

主分类号:G06F18/23

分类号:G06F18/23;G06F18/20;G06N3/094;G06N3/0464;H04L9/40

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2024.02.02#实质审查的生效;2024.01.16#公开

摘要:本发明公开了一种基于对抗生成shapelet的流量异常检测方法及系统,方法包括:判断至少一个流量数据时间序列的时间长度是否大于第一预设阈值;若大于第一预设阈值,则采用两个一维卷积层和一个平均池化层生成shapelet序列;基于判别器对shapelet序列与流量数据时间序列进行辨识,并添加对抗损失训练shapelet序列和流量数据时间序列,使生成的shapelet序列与流量数据时间序列的形状相差不大于第二预设阈值;计算训练后的shapelet序列和流量数据时间序列之间的DTW值,并根据DTW值将流量数据时间序列转化为基于shapelet序列的特征向量,与KNN分类器结合,输出流量异常检测结果。能够提高了流量异常检测的效率。

主权项:1.一种基于对抗生成shapelet的流量异常检测方法,其特征在于,包括:抓取流量数据,并将所述流量数据转换为CSV文件,其中,所述CSV文件中包含基于时间排序的至少一个流量数据时间序列;判断所述至少一个流量数据时间序列的时间长度是否大于第一预设阈值;若不大于第一预设阈值,则设是N个流量数据时间序列的集合,假设中流量数据时间序列具有长度,中的第i个流量数据时间序列由个元素组成:,i=1,…,N;随机选取一个流量数据时间序列作为第一个聚类中心;计算每个流量数据时间序列与当前已有类聚中心最短欧式距离Dx,其中,Dx的表达式为: , ,式中,为除聚类中心以外的任何一个流量数据时间序列,为第一个流量数据时间序列中的第一个元素,为第一个流量数据时间序列中的第二个元素,为第一个流量数据时间序列中的第三个元素,为第一个流量数据时间序列中的第n个元素,为第二个流量数据时间序列中的第一个元素,为第二个流量数据时间序列中的第二个元素,为第二个流量数据时间序列中的第三个元素,为第三个流量数据时间序列中的第n个元素;计算每个流量数据时间序列被选为下一个聚类中心的概率,直至选出K个聚类中心为,为所有元素的全部范围;根据k-means算法计算每个流量数据时间序列所属的聚类类别,其中,计算每个流量数据时间序列所属的聚类类别的表达式为: ,式中,为第i个聚类类别,为标记符号,为第i个流量数据时间序列,为第K个聚类中心,为计算函数;其中,,式中,表示第i个流量数据时间序列被归类到第K个聚类中心时为1,否则为0;将流量数据时间序列的突变点作为特殊点,从使用特殊点作为端点的原始子序列中提取shapelet序列,其中,特殊点为流量数据时间序列的峰值点,即h=argmaxfx和l=argminxfx;其中,fx表示流量数据时间序列的函数表达式,argmax表示取最大值时的自变量x的值,argmin表示取最小值时的自变量x的值;若大于第一预设阈值,则采用预设的shapelet生成器根据预设长度的滑动窗口提取所述CSV文件中某一流量数据时间序列的至少一个原始子序列,将所述至少一个原始子序列进行拼接,并经过一维卷积层和平均池化层运算后得到至少一个shapelet序列,其中,所述shapelet生成器包括两个一维卷积层和一个平均池化层;所述采用预设的shapelet生成器根据预设长度的滑动窗口提取所述CSV文件中某一流量数据时间序列的至少一个原始子序列,将所述至少一个原始子序列进行拼接,并经过一维卷积层和平均池化层运算后得到至少一个shapelet序列包括:设是N个流量数据时间序列的集合,假设中流量数据时间序列具有长度,中的第i个流量数据时间序列由个元素组成:,i=1,…,N;通过一个步长为1,长度为M的滑窗在上滑动,可以得到P条长度为M的原始子序列,P=Q-M+1,把第i个流量数据时间序列所有长度为M的原始子序列拼接起来并将结果记为,则有: ,式中,为第i个流量数据时间序列从第P时刻开始的长度为的原始子序列,表示拼接操作,为第i个流量数据时间序列从第1时刻开始的长度为M的原始子序列,为第i个流量数据时间序列从第2时刻开始的长度为M+1的原始子序列;在上沿着时间轴的方向使用步长为1,卷积核大小为w×P的卷积操作来获得生成的shapelet序列,其中,经过第一个卷积层,根据生成的第j条shapelet序列的表达式为: ,式中,表示第j个宽度为w的滤波器,表示偏置项,表示卷积操作;第一个卷积层的输出结果将被输入到第二个卷积层中,按照与第一个卷积层相同的逻辑,将在第二个卷积层上再次定义j个滤波器进行训练,其中,经过第二个卷积层,根据生成的第j条shapelet序列的表达式为: ,加入平均池化层,根据平均池化层对进行处理,其中,对进行处理的表达式为: ,式中,为滤波器的宽度,为滑窗的长度;则根据第i个流量数据时间序列生成k条shapelet序列,记为:,为第i个shapelet序列,为第i个shapelet序列的第l个元素,为第i个shapelet序列的第2个元素,为第i个shapelet序列的第j个元素,为第i个shapelet序列的第k个元素;基于判别器对所述至少一个shapelet序列与所述至少一个流量数据时间序列进行辨识,并添加对抗损失训练所述至少一个shapelet序列和所述至少一个流量数据时间序列,使生成的所述至少一个shapelet序列与所述至少一个流量数据时间序列的形状相差不大于第二预设阈值;计算训练后的所述至少一个shapelet序列和所述至少一个流量数据时间序列之间的DTW值,并根据所述DTW值将所述至少一个流量数据时间序列转化为基于shapelet序列的至少一个特征向量,与KNN分类器结合,输出流量异常检测结果。

全文数据:

权利要求:

百度查询: 南昌科晨电力试验研究有限公司;国网江西省电力有限公司电力科学研究院 一种基于对抗生成shapelet的流量异常检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。