申请/专利权人:北京国双科技有限公司
申请日:2018-09-30
公开(公告)日:2024-02-20
公开(公告)号:CN110969017B
主分类号:G06F40/289
分类号:G06F40/289;G06N3/0464;G06N3/0442;G06N3/045;G06N3/0985;G06Q50/18
优先权:
专利状态码:有效-授权
法律状态:2024.02.20#授权;2020.05.01#实质审查的生效;2020.04.07#公开
摘要:本发明提供一种司法数据的处理方法及系统,所述方法包括:获取需要预测司法数据的待办理案件的案件信息,所述司法数据包括罪名,所述案件信息包括所述待办理案件的文本信息。将文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于法条预测结果得到待办理案件的预测罪名,其中,所述罪名预测模型由基于样本数据和类标训练神经网络模型获得。本发明提供的司法数据处理方法,通过利用已经公开的司法文书数据预先训练神经网络模型得到罪名预测模型,将待办理案件的文本信息输入预测模型中进行预测得到对应的预测罪名,能缩短判决时间,提高判决准确性和效率。
主权项:1.一种司法数据的处理方法,其特征在于,所述方法包括:获取需要预测司法数据的待办理案件的案件信息,所述司法数据包括罪名,所述案件信息包括所述待办理案件的文本信息;将所述文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于所述法条预测结果得到所述待办理案件的预测罪名,其中,所述罪名预测模型由基于样本数据和类标训练神经网络模型获得;其中,将所述文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于所述法条预测结果得到所述待办理案件的预测罪名,包括:将所述文本信息输入所述罪名预测模型的输入层进行分词处理,得到离散词语,并将所述离散词语传输至所述罪名预测模型的词编码层;在所述词编码层,利用预先训练的词向量模型,将所述离散词语转化为预设维数的离散词语向量,并将所述离散词语向量传输至所述罪名预测模型的双向循环神经网络层;在所述双向循环神经网络层对所述离散词语向量进行训练,得到第一信息,其中,所述双向循环神经网络层中的从左往右的循环神经网络在输出当前时刻信息时包含了前面时刻的信息,所述双向循环神经网络层中的从右往左的循环神经网络在输出当前时刻信息时包含了后面时刻的信息,所述双向循环神经网络在输出第一信息时包含了上下文的信息;合并所述第一信息和所述离散词语向量,得到第二信息,将所述第二信息传输至所述罪名预测模型的卷积神经网络层;在所述卷积神经网络层,提取所述第二信息的局部特征,得到二维向量的第一特征信息,将所述第一特征信息传输至所述罪名预测模型的全局特征层;在所述全局特征层对所述第一特征信息进行处理,得到一维向量的第二特征信息;获取所述第二特征信息中包含的法条特征数据和罪名特征数据,基于所述法条特征数据和罪名特征数据,确定所述待办理案件的预测罪名,其中,所述基于所述法条特征数据和罪名特征数据,确定所述待办理案件的预测罪名,包括:抽取所述法条特征数据的部分特征数据;合并所述部分特征数据与所述罪名特征数据,得到所述待办理案件的预测罪名。
全文数据:
权利要求:
百度查询: 北京国双科技有限公司 一种司法数据的处理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。