【发明授权】一种财务报告舞弊检测方法及系统_南京审计大学_202211507923.7

导航：龙图腾网> 最新专利技术> 一种财务报告舞弊检测方法及系统_南京审计大学_202211507923.7

申请/专利权人：南京审计大学

申请日：2022-11-29

公开（公告）日：2024-01-23

公开（公告）号：CN115994217B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/205;G06F40/284;G06F40/289;G06F40/30;G06Q40/12

优先权：

专利状态码：有效-授权

法律状态：2024.01.23#授权;2023.05.09#实质审查的生效;2023.04.21#公开

摘要：本发明涉及一种财务报告舞弊检测方法及系统，属于数据处理技术领域，解决了现有因无法有效区分MDA语义及语义丢失导致舞弊检测不精确的问题。包括获取历史财务报告构建文本数据集；对文本数据集中每条文本数据进行分词得到分词结果，根据重要性阈值筛选分词结果并转换为词向量，得到词向量矩阵；从字、词、句和段四个维度构建中文可读性指标向量，根据中文可读性指标向量，获取每条文本数据的可读性向量，得到可读性向量矩阵；基于词向量矩阵和可读性向量矩阵，得到样本集；根据样本集训练分类模型，得到舞弊检测模型；预处理待预测的财务报告，将得到的词向量和可读性向量拼接后传入舞弊检测模型，得到检测结果。实现了财务报告舞弊的精确检测。

主权项：1.一种财务报告舞弊检测方法，其特征在于，包括如下步骤：获取历史财务报告，构建文本数据集；对文本数据集中每条文本数据进行分词，得到分词结果，根据重要性阈值，筛选分词结果并转换为词向量，得到文本数据集的词向量矩阵；从字、词、句和段四个维度构建中文可读性指标向量，根据中文可读性指标向量，获取文本数据集中每条文本数据的可读性向量，得到文本数据集的可读性向量矩阵；基于词向量矩阵和可读性向量矩阵，对每条文本数据对应的词向量和可读性向量进行拼接，作为一条样本，得到样本集；根据样本集训练分类模型，得到舞弊检测模型；预处理待预测的财务报告，将得到的词向量和可读性向量拼接后传入舞弊检测模型，得到检测结果；所述根据重要性阈值，筛选分词结果并转换为词向量，包括：将每条文本数据的分词结果作为特征，分类标签作为响应变量，采用随机森林模型构建多棵决策树；按分词结果中各词汇的重要性从高到低排序分词结果；根据重要性阈值，从每条文本数据的排序后的分词结果中按顺序选取相同数量的词汇，并且所有文本数据的平均累加重要性大于等于重要性阈值；采用HashTrick方法，将每条文本数据选取的词汇转换为词向量；所述从字、词、句和段四个维度构建中文可读性指标向量，包括：基于中文文本语言结构特征，根据常用字比率构建字的中文可读性指标；根据常用词比率、成语比率、专业词汇比率、逆接关系连接词比率和否定词比率构建词的中文可读性指标；将句号、问号、感叹号和分号的数量作为句子数，根据平均句长和陈述句比率构建句的中文可读性指标；根据段落平均数字数量构建段的中文可读性指标；将字的中文可读性指标、词的中文可读性指标、句的中文可读性指标和段的中文可读性指标组合为中文可读性指标向量；按照中文阅读难度的大小对中文可读性指标的各指标项设置了不同等级的权重；所述根据中文可读性指标向量，获取文本数据集中每条文本数据的可读性向量，包括：对文本数据集中每条文本数据，按中文可读性指标向量，分别将同一维度的指标项按照其权重计算得分并相加计算出字、词、句和段的中文可读性指标值，得到四维向量；对四维向量进行L2范数的正则化处理后，得到当前文本数据对应的可读性向量。

全文数据：

权利要求：

百度查询：南京审计大学一种财务报告舞弊检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种泥水盾构泥水循环系统管路堵塞智能预警方法_郑州轻工业大学_202310490445.1

下一篇：消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

相关技术

一种泥水盾构泥水循环系统管路堵塞智能预警方法_郑州轻工业大学_202310490445.1

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

一种对文言文中缺失文字的补全方法_丁杨_202311025114.7

一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种即时检验抗凝药物监测系统_北京倍肯恒业科技发展股份有限公司_202310581047.0

一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

用于控制空调的方法及装置、空调_青岛海尔空调电子有限公司_202210048335.5

QLED器件及其制备方法_安阳瑞森显示科技有限公司_202111133433.0

一种适用于热辅助治疗的硝酸2-(4-甲基噻唑-5-基)乙酯盐脑靶向脂质体_山东京卫制药有限公司_202311121383.3

检测相关技术

检测系统及检测方法_友达光电股份有限公司_202410215067.0

检测系统及检测方法_深圳大学_202410175086.5

钻孔检测方法、钻孔检测系统与检测装置_得力富企业股份有限公司_202110962130.3

倾斜检测装置、倾斜检测系统、倾斜检测方法及倾斜检测程序_株式会社电装_202280064735.3

检测电路和电弧检测装置_湖南华菱涟源钢铁有限公司_202322497410.9

健康检测设备及健康检测方法_歌尔科技有限公司_202410170462.1

检测方法、检测装置及涂布系统_三一技术装备有限公司_202311853563.0

检测装置_富联裕展科技(深圳)有限公司_202322610699.0

检测装置_株式会社日本显示器_202311461688.9

检测装置_株式会社电装_202280065132.5

报告相关技术

一种短信状态报告实时推送系统_深圳市欣易辰信息科技有限公司_202311073059.9

用于生成信道状态信息报告的方法和装置_联想(新加坡)私人有限公司_202080052607.8

每传输和接收点（TRP）波束故障报告_高通股份有限公司_202180102710.3

在多个发送接收点（TRP）场景中对信道状态信息报告进行复用_高通股份有限公司_202410157407.9

一种流域梯级电厂监控系统故障处理报告自动生成方法_湖北清江水电开发有限责任公司_202410200180.1

一种报告生成方法、装置及计算机可读存储介质_深圳供电局有限公司_202410243216.4

基于模板定制的电价报告生成方法及装置_广东电网有限责任公司_202410134205.2

自动化服务质量评估系统及其报告生成方法_中国标准化研究院_202410307427.X

报告文件生成方法、装置、电子设备和存储介质_北京锐安科技有限公司_202011333178.X

一种诊断报告标准化方法、装置、终端及存储介质_南方科技大学_202311818550.X

方法相关技术

制造方法_意法半导体(克洛尔2)公司_202311475458.8

增殖方法_花王株式会社_202080014224.1

训练数据生成方法、图像检测方法、图像分类方法及装置_第四范式(北京)技术有限公司_202211345497.1

图像特征处理方法、图像对比方法、模型训练方法及装置_浙江深象智能科技有限公司_202410418358.X

编码方法、解码方法和处理比特流的方法_松下电器(美国)知识产权公司_202410304249.5

控制棒组件的安装方法、取出方法以及更换方法_中国原子能科学研究院_202111129136.9

排烟机拖车及其掉头方法、自行行走方法_苏州瑞奇安机电科技有限公司_202410210474.2

视频处理方法、影视视频处理方法及装置_阿里巴巴集团控股有限公司_202010147566.2

半导体结构及其制备方法、晶圆切割方法_北京弘图半导体有限公司_202410157714.7

喷墨记录方法及层合体的制造方法_富士胶片株式会社_202280064929.3

龙图腾网&IPTOP

【发明授权】一种财务报告舞弊检测方法及系统_南京审计大学_202211507923.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务