买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】物联网的多协议解析方法、电子设备和存储介质_中汽数据(天津)有限公司;中汽数据有限公司_202310330398.4 

申请/专利权人:中汽数据(天津)有限公司;中汽数据有限公司

申请日:2023-03-31

公开(公告)日:2024-04-09

公开(公告)号:CN116033048B

主分类号:H04L69/22

分类号:H04L69/22;H04L67/12;H04L69/165;H04L69/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.05.16#实质审查的生效;2023.04.28#公开

摘要:本发明涉及协议解析领域,公开了一种物联网的多协议解析方法、电子设备和存储介质,该方法包括:获取多个待解析会话,并确定每个待解析会话对应的协议类型;针对协议类型为未知协议的多个待解析会话,基于预设模板对多个待解析会话进行分组,得到待解析会话组;针对每组待解析会话组中的每个待解析会话,根据响应字符,确定与待解析会话相对应的多个待划分响应;针对每个待解析会话,基于预设ASCII代码,确定待解析会话中各待划分响应所对应的通信阶段;针对每组待解析会话组中的每个通信阶段,确定通信阶段中的字段特征,根据字段特征构建与待解析会话组相对应的协议解析结果。本实施例能够实现大规模协议解析以及对未知协议进行准确解析的效果。

主权项:1.一种物联网的多协议解析方法,其特征在于,包括:获取多个待解析会话,并确定每个所述待解析会话对应的协议类型;其中,所述协议类型包括已知协议和未知协议;将待解析会话输入至预先训练的随机森林分类器中,若与任一协议种类均不匹配,则认为是未知协议;若所述协议类型为未知协议,对多个所述待解析会话进行信息提取,确定每个所述待解析会话对应的关键信息;其中,所述关键信息包括目标IP、目标关键字以及域关键字;所述域关键字通过下述方式获取:通过对DNS数据包解析得到域名列表,使用目标IP提取和搜索出与域名列表对应的IP列表,基于所述IP列表中的IP进行反向域名查找,在域名列表中提取域关键字;针对每个所述待解析会话,若所述待解析会话的关键信息与预设模板中的一组关键信息相对应,则确定所述待解析会话对应的待解析会话组,若所述待解析会话的关键信息与预设模板中的任一组关键信息均不对应,则根据所述待解析会话的关键信息更新所述预设模板,并建立所述待解析会话对应的待解析会话组;预设模板是包含用于区分不同未知协议的关键信息的模板;针对每组所述待解析会话组中的每个所述待解析会话,根据响应字符,确定与所述待解析会话相对应的多个待划分响应;针对每个所述待解析会话,基于预设ASCII代码,确定所述待解析会话中各所述待划分响应所对应的通信阶段;其中,所述通信阶段包括连接建立阶段、数据传输阶段和连接终止阶段;针对每组所述待解析会话组中的每个所述通信阶段,对所述通信阶段内的协议进行匿名预处理,确定所述通信阶段中的字段特征,并根据所述字段特征构建与所述待解析会话组相对应的协议解析结果;其中,所述匿名预处理为根据不同的协议、特定的位置和长度,将用户信息替换为等长的随机字符串;针对所述协议类型为已知协议的每个待解析会话,将所述待解析会话输入至预先训练的随机森林分类器中,得到与所述待解析会话对应的协议种类;其中,所述随机森林分类器基于样本会话以及与所述样本会话对应的协议种类训练得到;其中,针对已知协议,首先从设备端收集已知协议通信数据作为样本会话,并提取数据的统计特征,包括数据包的数量、有效数据的大小、数据包的到达时间间隔,对客户端和服务器之间的两个方向分别进行统计提取,并计算所述统计特征的最小值、最大值、平均值和方差,从而构建协议的训练样本;对样本会话进行标记,获得由数据特征向量及其对应的协议种类组成的训练数据集,采用所述训练数据集训练模型并进行测试,记录所有结果以供分析,确定准确率最高的参数,在模型中应用调整后的参数来构建随机森林分类器,通过随机森林分类器对已知协议进行识别;针对每种所述协议种类对应的待解析会话,根据与所述协议种类对应的解析方法,对所述待解析会话进行解析,得到协议解析结果。

全文数据:

权利要求:

百度查询: 中汽数据(天津)有限公司;中汽数据有限公司 物联网的多协议解析方法、电子设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。