申请/专利权人:长沙理工大学
申请日:2020-03-24
公开(公告)日:2023-12-01
公开(公告)号:CN111459964B
主分类号:G06F16/24
分类号:G06F16/24;G06N20/00
优先权:
专利状态码:有效-授权
法律状态:2023.12.01#授权;2020.08.21#实质审查的生效;2020.07.28#公开
摘要:本发明公开了一种面向模板基于Word2vec的日志异常检测方法及装置,本发明方法包括以下步骤:对原始日志进行预处理得到日志模板,对日志模板进行切割,得到日志序列;基于Word2vec求取日志模板的特征向量,其中以日志模板的ID序号作为Word2vec的输入;根据日志模板的特征向量求取日志序列的特征向量;将日志序列的特征向量进行机器学习得到异常检测模型并根据异常检测模型进行检测。本发明考虑从Word2vec处理对象为模板入手,能够减少训练数据规模。而且本发明对原始日志进行了预处理,通过预处理减少日志异常检测所消耗的时间以避免影响最终异常检测结果。
主权项:1.一种面向模板基于Word2vec的日志异常检测方法,其特征在于,包括以下步骤:对原始日志进行预处理得到日志模板,对所述日志模板进行切割,得到日志序列;所述日志模板的模板形式为所述日志消息中的变量部分用通配符进行替代,而常量部分保持不变;基于Word2vec中的CBOW模型或Skip-gram模型求取所述日志模板的特征向量,其中以所述日志模板的ID序号作为所述Word2vec的输入;求取所述日志序列中所有所述日志模板的特征向量的质心或对所述日志模板进行赋权处理,得到所述日志序列的特征向量,其中,求取所述日志序列中所有所述日志模板的特征向量的质心包括:对所述日志模板的ID序号输入所述Word2vec后的输出结果求质心,得到所述日志序列的特征向量,具体的求质心的公式如下: pl为日志模板的特征向量,l为日志事件,f为日志序列;将所述日志序列的特征向量进行机器学习得到异常检测模型并根据所述异常检测模型进行检测。
全文数据:
权利要求:
百度查询: 长沙理工大学 一种面向模板基于Word2vec的日志异常检测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。