申请/专利权人:中国司法大数据研究院有限公司
申请日:2023-12-20
公开(公告)日:2024-04-12
公开(公告)号:CN117875759A
主分类号:G06Q10/0639
分类号:G06Q10/0639;G06Q10/0635;G06Q40/00;G06Q50/18;G06N3/0442;G06N3/0455;G06N3/049;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.30#实质审查的生效;2024.04.12#公开
摘要:本发明公开了一种司法案件对企业基本面影响评价方法。本方法为:1获取设定时间段内的金融指标数据,获取该设定时间段内所选多家上市企业的股市数据、历史案件数据;2计算设定时间段内第i家上市企业的时序数据集xi、差值序列yi和案件向量zi;3将所选每一家上市企业的差值序列、案件向量、时序数据集作为一个训练样本,得到一训练样本集;4利用所述训练集训练多步序列预测模型,然后利用所述测试集对训练后的多步序列预测模型进行测试;5将一目标上市公司的案件向量z和差值序列y输入多步序列预测模型,预测得到当前案件数据对该目标上市公司τ时间步后的影响幅度。本发明能够量化评估司法案件对企业基本面的影响程度。
主权项:1.一种司法案件对企业基本面影响评价方法,其步骤包括:1获取设定时间段内的金融指标数据,获取该设定时间段内所选多家上市企业的股市数据、历史案件数据;2将该设定时间段内所选每一家上市企业历史交易日按照时间顺序构建时序数据集,第i家上市企业的时序数据集记为xi;计算该设定时间段内所选每一家上市企业每日涨跌幅与对应金融指标数据中对应日的指数涨跌幅的差值,得到对应上述企业的差值序列,第i家上市企业的差值序列记为yi;使用预训练的连续词袋模型将所选每一家上市企业的案件信息转化为词向量,得到对应上述企业的案件向量,第i家上市企业的案件向量记为zi;3将所选每一家上市企业的差值序列、案件向量、时序数据集作为一个训练样本,得到一训练样本集;将所述训练样本集划分为训练集和测试集;4利用所述训练集训练多步序列预测模型,然后利用所述测试集对训练后的多步序列预测模型进行测试;其中训练所述多步序列预测模型的方法为:从所述训练集中获取数据yi,t-k:t、zi,t-k:t、xi,t-k:t+τ并将其输入所述多步序列预测模型,预测时间点t之后τ时间步第i家上市企业在q分位数下的日涨跌幅与对应金融指标数据中对应日的指数涨跌幅的差值,预测值记为其中,将时间点t之前k时间步的时间点t-k到时间点t的区间记为t-k:t,将时间点t到t之后τ时间步的时间点t+τ的区间记为t:t+τ,时间点t-k到时间点t+τ的区间记为t-k:t+τ;yi,t-k:t为t-k:t区间内第i家上市企业的日涨跌幅与对应金融指标数据中对应日的指数涨跌幅的差值构成的时序数据集,zi,t-k:t为t-k:t区间内第i家上市企业案件信息构成的时序数据集,xi,t-k:t+τ为t-k:t+τ区间内第i家上市企业交易日时间点构成的时序数据集;训练所述多步序列预测模型所采用的分位数损失函数其中,Ω代表yi,t-k:t数据域,其中包含M条时序样本,W代表fq·权重;τmax为预测步数的最大值;5将一目标上市公司的当前案件数据转化为词向量后得到案件向量z,计算过去一段时间段内该目标上市企业每日涨跌幅与对应金融指标数据中对应日的指数涨跌幅的差值得到差值序列y,将案件向量z和差值序列y输入训练、测试后的所述多步序列预测模型,预测得到当前案件数据对该目标上市公司τ时间步后的影响幅度。
全文数据:
权利要求:
百度查询: 中国司法大数据研究院有限公司 一种司法案件对企业基本面影响评价方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。