买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于树结构的异常案件识别方法、装置、设备及存储介质_中国平安财产保险股份有限公司_202011211514.3 

申请/专利权人:中国平安财产保险股份有限公司

申请日:2020-11-03

公开(公告)日:2024-04-30

公开(公告)号:CN112288025B

主分类号:G06F18/2433

分类号:G06F18/2433;G06F18/2431;G06F18/214;G06N20/20

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.11.16#实质审查的生效;2021.01.29#公开

摘要:本申请公开了一种基于树结构的异常案件识别方法、装置、设备及存储介质,属于人工智能技术领域,包括:从初始案件数据库中获取原始训练样本;基于IForest算法计算原始训练样本的异常分值;将原始训练样本的异常分值与预设阈值进行比对,根据比对结果对原始训练样本进行分类,并形成目标训练集;通过目标训练集对初始识别模型进行模型训练,输出异常识别模型;将待识别案件的案件数据导入到异常识别模型,输出识别结果。本申请还涉及区块链技术,原始训练样本的异常分值可存储于区块链中。本申请基于IForest算法计算原始训练样本的异常分值并依据异常分值对原始训练样本进行分类的过程有效排除了人为因素的干扰,提高了案件异常识别模型的准确度。

主权项:1.一种基于树结构的异常案件识别方法,其特征在于,包括:从初始案件数据库中获取预定时间周期内的原始训练集,其中,所述原始训练集包括若干个原始训练样本;基于随机孤立森林算法计算所述原始训练集中每一个原始训练样本的异常分值;将每一个所述原始训练样本的异常分值与预设阈值进行比对,根据比对结果对所述原始训练样本进行分类,得到正样本和负样本;将识别得到的所述正样本和所述负样本进行随机组合,形成目标训练集;构建初始识别模型,并通过所述目标训练集对所述初始识别模型进行模型训练,输出异常识别模型;获取待识别案件的案件数据,将所述待识别案件的案件数据导入到所述异常识别模型,输出识别结果;所述基于随机孤立森林算法计算所述原始训练集中每一个原始训练样本的异常分值的步骤,具体包括:通过所述原始训练集中的若干个原始训练样本构建二叉树;计算每一个所述原始训练样本在所述二叉树中的路径长度,并基于所述路径长度,计算每一个所述原始训练样本的异常分值;所述计算每一个所述原始训练样本在所述二叉树中的路径长度,并基于所述路径长度,计算每一个所述原始训练样本的异常分值的步骤,具体包括:统计每一个所述原始训练样本在二叉树中的边数目,并根据边数目计算每一个所述原始训练样本在二叉树中的初始路径长度;计算路径修正值,通过所述路径修正值对每一个所述原始训练样本的初始路径长度进行修正,得到每一个所述原始训练样本在二叉树中的路径长度;通所述路径长度,计算每一个所述原始训练样本的异常分值;通过以下公式计算每一个所述原始训练样本的异常分值:;式中,x为原始训练样本,Scorex为原始训练样本x的异常分值,hx为原始训练样本x在二叉树上的路径长度,Ehx表示数据x在多棵二叉树的路径长度的均值,表示单棵二叉树的训练样本的样本数,表示用条数据构建的二叉树的平均路径长度,其中,hx可以用以下公式计算:;式中,h0x为原始训练样本x的初始路径长度,Cn为路径修正值;Cn的计算公式如下:;其中,Hn-1基于lnn-1+M进行计算,M为欧拉常数,n为原始训练样本中与训练样本x落在同一叶子节点的样本数;所述通过所述原始训练集中的若干个原始训练样本构建二叉树的步骤,具体包括:在所述原始训练集中抽取若干个所述原始训练样本,并将所述抽取到的若干个原始训练样本导入到预设的初始二叉树模型;获取每一个所述原始训练样本的样本特征,并将获取到的所述样本特征进行组合,形成特征集合;通过所述特征集合对所述原始训练集进行划分,直至所述原始训练集的原始训练样本不可再分,输出所述二叉树;所述通过所述特征集合对所述原始训练集进行划分,直至所述原始训练集的原始训练样本不可再分,输出所述二叉树的步骤,具体包括:依次在所述特征集合中的随机提取样本特征,确定提取的所述样本特征的最大值和最小值;在所述最大值和所述最小值之间随机选择一个数值作为切割点,对所述原始训练集的原始训练样本进行划分;历遍所述特征集合的样本特征,直至所述二叉树的深度满足预设深度,获取深度满足要求的所述二叉树。

全文数据:

权利要求:

百度查询: 中国平安财产保险股份有限公司 基于树结构的异常案件识别方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。