申请/专利权人:平安直通咨询有限公司上海分公司
申请日:2020-04-24
公开(公告)日:2024-04-30
公开(公告)号:CN111612040B
主分类号:G06Q40/00
分类号:G06Q40/00;G06N20/10
优先权:
专利状态码:有效-授权
法律状态:2024.04.30#授权;2021.06.22#实质审查的生效;2020.09.01#公开
摘要:本申请是关于一种基于孤立森林算法的财务数据异常检测方法及相关装置,属于数据分析技术领域,包括:从数据库中获取预定时间段的财务数据并划分为多类子数据集;将每类子数据集进行数据冲销处理后,拆分为正数据集及负数据集;分别生成正数据集及负数据集的特征宽表,并对正数据集的特征宽表进行群组基线划分;将群组基线变换后的正数据集特征宽表输入孤立森林算法模型,得到第一异常数据;将所述第一异常数据的主体字段与所述负数据集的特征宽表中的主体字段进行比对,以确定所述第一异常数据中的风险数据。本申请的实施例有效提升财务数据风险数据分析的可靠性和准确性。
主权项:1.一种基于孤立森林算法的财务数据异常检测方法,其特征在于,所述方法包括:从数据库中获取预定时间段的财务数据,并根据预定数据类别字段将所述财务数据划分为多类子数据集;将每类所述子数据集中贷方原币字段中报销单号相同、两报销单的贷方原币字段的金额字段正负值相反且绝对值相同的报销单号对应的数据删除后,得到每类所述子数据集中冲销后的数据集;将每类所述子数据集中冲销后的数据集,根据贷方原币金额字段的正负值拆分为正数据集及负数据集;根据预设特征表中财务数据的通用统计特征和业务特征,对所述正数据集及所述负数据集分别进行特征构造,生成所述正数据集及所述负数据集的特征宽表;对所述正数据集的特征宽表中的机构按照机构规模基线划分为不同层级的机构,并对所述不同层级的机构的数据进行零均值归一化处理得到群组基线变换后的正数据集特征宽表;将所述群组基线变换后的正数据集特征宽表输入孤立森林算法模型,得到第一异常数据;将所述第一异常数据的主体字段与所述负数据集的特征宽表中的主体字段进行比对,以确定所述第一异常数据中的风险数据。
全文数据:
权利要求:
百度查询: 平安直通咨询有限公司上海分公司 基于孤立森林算法的财务数据异常检测方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。