买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种量刑结果预测方法、装置、设备及存储介质_讯飞智元信息科技有限公司_201810971990.1 

申请/专利权人:讯飞智元信息科技有限公司

申请日:2018-08-24

公开(公告)日:2023-09-01

公开(公告)号:CN109241528B

主分类号:G06Q50/18

分类号:G06Q50/18;G06F40/289;G06F40/295;G06F40/30;G06N3/0464;G06N3/0442;G06N3/045;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.09.01#授权;2019.02.19#实质审查的生效;2019.01.18#公开

摘要:本申请提供了一种量刑结果预测方法、装置、设备及存储介质,方法包括:获取指定罪名的指定案件的非判决书作为目标非判决书;从目标非判决书中获取指定量刑要素标签对应的量刑要素作为目标量刑要素;将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的指定案件的量刑结果;量刑结果预测模型以从指定罪名的训练判决书中抽取的、与指定量刑要素标签对应的量刑要素为训练样本,以从训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。本申请提供的量刑结果预测方法、装置、设备及存储介质可自动预测出比较准确的量刑结果,该量刑结果可供法官参考,以辅助法官进行判决。

主权项:1.一种量刑结果预测方法,其特征在于,包括:获取指定罪名的指定案件的非判决书,作为目标非判决书;利用预先建立的非判决书要素抽取模型,从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;所述非判决书要素抽取模型以训练非判决书为训练样本,以所述训练非判决书中与所述指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及,量刑要素为空的得分为样本标签进行训练得到;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。

全文数据:一种量刑结果预测方法、装置、设备及存储介质技术领域本申请涉及人工智能技术领域,尤其涉及一种量刑结果预测方法、装置、设备及存储介质。背景技术近年来,随着大数据和人工智能技术的迅速发展,使用机器来辅助人工已经成为各行各业的热点方向。司法信息化建设是中国司法实现现代化的重要方向,司法相关的工作也由传统的一线法官针对不同案情,查阅资料和法律文献,逐步演变为一线法官在机器的辅助之下完成如庭审记录、案情分析等事务,由此出现了“智慧法院”的建设体系。智慧法院的整体架构包括将人工智能技术和大数据技术用于服务社会公众、服务案件审判、服务判决执行、服务司法管理四个方面。然而,对于服务案件审判这一应用场景,目前尚不存在能够自动量刑的方案。发明内容有鉴于此,本申请提供了一种量刑结果预测方法、装置、设备及存储介质,用以基于案件相关文书自动预测出量刑结果以供法官参考,其技术方案如下:一种量刑结果预测方法,包括:获取指定罪名的指定案件的非判决书,作为目标非判决书;从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。其中,所述从所述指定罪名的训练判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素的过程包括:利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素;其中,所述判决书要素抽取模型以标注有指定量刑要素标签和指定判决结果要素标签的训练判决书进行训练得到。其中,所述利用预先建立的判决书要素抽取模型,从所述未标注判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素,包括:通过所述判决书要素抽取模型中的语义向量确定模块,对所述未标注判决书进行分词处理,确定分词处理得到的每个词对应的语义向量;通过所述判决书要素抽取模型中的要素标签确定模块和所述每个词对应的语义向量,确定与每个语义向量对应的词的要素标签;将要素标签相同的连续多个词合并,合并后的内容作为该要素标签对应的要素。其中,所述从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,包括:利用预先建立的非判决书要素抽取模型,从所述目标非判决书中抽取与所述指定量刑要素标签对应的量刑要素;其中,所述非判决书要素抽取模型以训练非判决书为训练样本,以基于所述指定量刑要素标签对所述训练非判决书进行标注的标注结果为样本标签进行训练得到。其中,所述基于所述指定量刑要素标签对所述非判决书进行标注的标注结果包括:所述训练非判决书中与所述指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及,量刑要素为空的得分。其中,所述利用预先建立的非判决书要素抽取模型,从所述目标非判决书中抽取与所述指定量刑要素标签对应的量刑要素,包括:通过所述非判决书要素抽取模型确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的信息作为目标量刑要素信息,所述目标量刑要素信息包括所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及量刑要素为空的得分;通过所述目标量刑要素信息,确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素。其中,所述通过所述非判决书要素抽取模型确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的信息作为目标量刑要素信息,包括:将所述目标非判决书和问题标签文本,输入所述非判决书要素抽取模型,获得所述非判决书要素抽取模型输出的目标答案信息,作为所述目标量刑要素信息;其中,问题标签文本为包含指定问题标签的文本,所述指定问题标签为将所述指定量刑要素标签转换为问题形式后的标签;所述目标答案信息包括与所述指定问题标签对应的答案的起始位置和起始位置得分、结束位置和结束位置得分,以及,答案为空的得分。其中,所述通过所述目标量刑要素信息,确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素,包括:若所述指定问题标签中存在具有多个答案的目标问题标签,则从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案;若所述剩余答案为多个,则将多个所述剩余答案进行去重合并处理,去重合并处理后得到的答案作为所述目标量刑要素。其中,所述从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案,包括:从所述目标问题标签对应的多个答案中确定预设个答案组成第一候选答案集合,其中,所述预设个答案的得分均高于其它答案的得分,每个答案的得分通过该答案的起始位置得分和结束位置得分确定;将所述第一候选答案集合中得分低于第一阈值的候选答案去除,获得第二候选答案集合,其中,所述第一阈值为所述目标问题标签对应的答案为空的得分;将所述第二候选答案集合中得分低于第二阈值的非最高得分的候选答案去除,获得所述剩余答案,其中,所述第二阈值基于所述最高得分的候选答案的得分设定。其中,所述从所述目标问题标签对应的多个答案中滤除不满足预设条件的答案,获得剩余答案,还包括:若所述第一候选答案集合中各个候选答案的得分均低于所述第一阈值,则确定所述目标问题标签对应的答案为空。一种量刑结果预测装置,包括:非判决书获取模块、量刑要素确定模块和量刑结果预测模块;所述非判决书获取模块,用于获取指定罪名的指定案件的非判决书,作为目标非判决书;所述量刑要素确定模块,用于从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;所述量刑结果预测模块,用于将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。一种量刑结果预测设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,所述程序具体用于:获取指定罪名的指定案件的非判决书,作为目标非判决书;从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述的量刑结果预测方法的各个步骤。经由上述方案可知,本申请提供的量刑结果预测方法、装置、设备及存储介质,首先获取指定罪名的指定案件的目标非判决书,然后从目标非判决书中获取与指定量刑要素标签对应的目标量刑要素,最后将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的量刑结果。由此可见,本申请提供的量刑结果预测方法、装置、设备及存储介质,可基于指定案件的非判决书,利用预先建立的量刑结果预测模型自动预测出指定案件的量刑结果,该量刑结果可供法官参考,以辅助法官对指定案件进行判决,从而能够提高案件的审判效率。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的量刑结果预测方法的流程示意图;图2本申请实施例提供的利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素的实现过程的流程示意图;图3为本申请实施例提供的判决书要素抽取模型的拓扑结构的一示例的示意图;图4为本申请实施例提供的利用非判决书要素抽取模型从目标非判决书中抽取与指定量刑要素标签对应的量刑要素的实现过程的流程示意图;图5为本申请实施例提供的非判决书要素抽取模型的拓扑结构的一示例的示意图;图6为本申请实施例提供的从目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案的实现过程的流程示意图;图7为本申请实施例提供的量刑结果预测装置的结构示意图;图8为本申请实施例提供的量刑结果预测设备的结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。发明人在实现本发明创造的过程中发现:现有技术中存在一些量刑结果预测方案,这些量刑结果预测方案大多为:采用正则表达式、上下文无关文法、命名实体识别等方式提取法律文书的情节信息,之后对提取的信息进行结构化,用数学模型来描述数据的特点和规律,计算出与其最相符的数学模型或算法,人工智能通过模拟算法,根据情节推导量刑结果。然而,现有量刑结果预测方案基本都是基于传统的机器学习方法,需要设计较多的规则正则表达式、特征上下文无关问答、命名实体识别等,需要大量人工介入,且由于法律相关文书描述复杂,案由众多,很难将这种方案推广到较多案由,辅助量刑效果比较差。为了克服现有方案存在的问题,本申请实施例提供了一种量刑结果预测方法,请参阅图1,示出了该量刑结果预测方法的流程示意图,可以包括:步骤S101:获取指定罪名的指定案件的非判决书,作为目标非判决书。其中,指定罪名可以为法律规定的罪名中的任一种,如抢劫罪、盗窃罪、诈骗罪、挪用资金罪、抢夺罪、敲诈勒索罪等,即本申请提供的量刑结果预测方法适用范围较广。其中,非判决书可以但不限定为询问笔录、庭审笔录、起诉书等。需要说明的是,指定案件的非判决书可能为一份也可能为多份,比如,可能会针对不同的对象做询问笔录,如此会获得多份询问笔录。步骤S102:从目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素。需要说明的是,指定量刑要素标签是基于指定罪名设定的,指定量刑要素标签对应的量刑要素指的是目标非判决书中与指定量刑要素标签对应的内容。步骤S103:将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的指定案件的量刑结果。其中,量刑结果预测模型以从指定罪名的训练判决书中抽取的、与指定量刑要素标签对应的量刑要素为训练样本,以从训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。需要说明的是,判决书的书写格式一般非常规范,并且判决书中信息主要包括:被告人基本信息、量刑相关情节以及量刑结果,因此,可基于指定罪名的判决书的内容设定量刑要素标签和判决结果要素标签。以指定罪名为盗窃罪为例,可设定量刑要素标签包括:是否入室盗窃、是否扒窃、是否有前科、是否残疾人、盗窃金额、认罪悔罪态度是否良好、是否坦白、是否自首等,可设定指定判决结果要素标签包括主刑、附加刑等。另外,考虑到目标量刑要素为离散数据,量刑结果预测模型可以但不限定为SVM模型、逻辑回归模型、深度神经网络模型等。本申请实施例提供的量刑结果预测方法,首先获取指定罪名的指定案件的目标非判决书,然后从目标非判决书中获取与指定量刑要素标签对应的目标量刑要素,最后将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的指定案件的量刑结果。本申请实施例提供的量刑结果预测方法可基于指定案件的非判决书,利用预先建立的量刑结果预测模型自动预测出量刑结果,且预测出的量刑结果比较准确,该量刑结果可供法官参考,具有较好的辅助量刑效果。在上述实施例提供的量刑结果预测方法中,用于预测量刑结果的量刑结果预测模型的训练样本为从指定罪名的训练判决书中抽取的、与指定量刑要素标签对应的量刑要素,样本标签为从训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素。以下对从训练判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素的实现过程进行说明。在一种可能的实现方式中,可利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素。其中,判决书要素抽取模型以标注有指定量刑要素标签和指定判决结果要素标签的训练判决书进行训练得到。需要说明的是,由于判决书的书写格式比较规范,因此,在训练判决书要素抽取模型时,只需要标注少量的判决书即可,比如可标注500~1000份判决书,用这些标注好的判决书训练判决书要素抽取模型。即,先用少量标注有指定量刑要素标签和指定判决结果要素标签的判决书训练判决书要素抽取模型,然后用训练得到的判决书要素抽取模型从未标注判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素,抽取的数据用于训练量刑结果预测模型。在一种可能的实现方式中,可基于BIOES标签体系对训练判决书进行标注,在BIOES标签体系中,用B表示标签起始词,这里的标签起始词指的是标签对应的要素的起始词,用I表示标签中间词,即标签对应的要素的中间词,用E表示标签结束词,即标签对应的要素的结束词,用S表示单个标签词,即标签对应的要素只有一个词,用O表示非要素词。示例性地,对于“是否坦白”而言,相关的标签有B_是否坦白、I_是否坦白、E_是否坦白、S_是否坦白。进一步地,请参阅图2和图3,图2示出了利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素的实现过程的流程示意图,图3示出了判决书要素抽取模型的拓扑结构的一示例的示意图,从未标注判决书中抽取要素的过程可以包括:步骤S201:通过判决书要素抽取模型中的语义向量确定模块图3中的301,对未标注判决书进行分词处理,确定分词处理得到的每个词对应的语义向量。在一种可能的实现方式中,确定分词处理得到的每个词对应的语义向量的过程可以包括:对于每个词执行:首先,识别词的词性和词的命名实体;然后,分别将词、词的词性、词的命名实体转换为向量,比如,可通过wordembedding模型将词、词的词性、词的命名实体转换为向量,获得词对应的向量、词的词性对应的向量和词的命名实体对应的向量;最后,将词对应的向量、词的词性对应的向量、词的命名实体对应的向量进行拼接通过图3中的向量拼接模块concat将三个向量拼接在一起,拼接后得到的向量作为词的语义向量。为了使每个词对应的语义向量的语义更丰富,在另一种可能的实现方式中,对于每个词而言,除了需要获得词对应的向量、词的词性对应的向量、词的命名实体对应的向量外,还需要将词中的各个字转换为向量,将各个字对应的向量进行拼接,然后通过特征提取模块如卷积神经网络CNN从拼接后的向量中提取特征向量,最后将词对应的向量、词的词性对应的向量、词的命名实体对应的向量以及上述提取的特征向量进行拼接通过图3中的向量拼接模块concat将四个向量拼接在一起,拼接后得到的向量作为词的语义向量。步骤S202:通过判决书要素抽取模型中的要素标签确定模块图3中的302和每个词对应的语义向量,确定与每个语义向量对应的词的要素标签。具体地,将每个词对应的语义向量输入要素标签确定模块,获得要素标签确定模块输出的、与输入的语义向量对应的词的要素标签,如此,便获得了未标注判决书中每个词的要素标签。另外,判决书要素抽取模型中的要素标签确定模块可以但不限定为双向BiLSTM即双向LSTM。步骤S203:将要素标签相同的连续多个词合并,合并后的内容作为该要素标签对应的要素。示例性的,假设词a对应的要素标签为“B_是否坦白”、词b对应的要素标签为“I_是否坦白”、词c对应的要素标签为“I_是否坦白”,词d对应的要素标签为“E_是否坦白”,由于词a、词b、词c和词d对应的要素标签均为“是否坦白”,因此,将词a、词b、词c和词d合并到一起作为要素标签“是否坦白”对应的要素。在本申请的另一实施例中,对上述实施例中的从目标非判决书中获取与指定量刑要素标签对应的量刑要素进行介绍。在一种可能的实现方式中,从目标非判决书中获取指定量刑要素标签对应的量刑要素的过程可以包括:利用预先建立的非判决书要素抽取模型,从目标非判决书中抽取与指定量刑要素标签对应的量刑要素。其中,非判决书要素抽取模型以训练非判决书为训练样本,以基于指定量刑要素标签对训练非判决书进行标注的标注结果为样本标签进行训练得到。在一种可能的实现方式中,基于指定量刑要素标签对训练非判决书进行标注的标注结果可以包括:训练非判决书中与指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分。考虑到某个或某些指定量刑要素标签可能不会在训练非判决书中出现,相应地,非判决书中也就不会存在与某个或某些指定量刑要素标签对应的量刑要素,基于此,在另一种可能的实现方式中,基于指定量刑要素标签对训练非判决书进行标注的标注结果可以包括:训练非判决书中与指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及,量刑要素为空的得分。请参阅图4,示出了利用基于上述第二种标注方式标注的非判决书训练得到的非判决书要素抽取模型,从目标非判决书中抽取指定量刑要素标签对应的量刑要素的实现过程的流程示意图,可以包括:步骤S401:通过非判决书要素抽取模型,确定目标非判决书中与指定量刑要素标签对应的量刑要素的信息,作为目标量刑要素信息。其中,目标量刑要素信息包括目标非判决书中与指定量刑要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及量刑要素为空的得分。在一种可能的实现方式中,非判决书要素抽取模型可以采用阅读理解模型,该模型的输入包括非判决书和指定量刑要素标签,在一种优选的实现方式中,为了提升阅读理解模型的效果,可基于指定量刑要素标签的语义,将指定量刑要素标签转换为问题形式,比如,指定量刑要素标签为:“是否认罪”,则可将其转换为:“对于你的所作所为,你是否认罪”,对指定量刑要素标签进行转换后,得到指定问题标签。需要说明的是,在一种可能的实现方式中,对于每个指定要素标签,可将其转换为一个问题,用该问题作为标签训练阅读理解模型;为了进一步提升阅读理解模型的效果,在另一种可能的实现方式中,对于每个指定要素标签,可基于其语义将其转换为多个问题,用多个问题训练阅读理解模型。则通过非判决书要素抽取模型,确定目标非判决书中与指定量刑要素标签对应的量刑要素的信息,作为目标量刑要素信息的过程可以包括:将目标非判决书和问题标签文本输入非判决书要素抽取模型阅读理解模型,获得非判决书要素抽取模型输出的目标答案信息,作为目标量刑要素信息。其中,问题标签文本为包含指定问题标签的文本,目标答案信息包括与指定问题标签对应的答案的起始位置和起始位置得分、结束位置和结束位置得分,以及答案为空的得分。请参阅图5,示出了非判决书要素抽取模型的拓扑结构的一示例的示意图,图5示出的非判决书要素抽取模型的输入为非判决书和问题标签文本,图5中的Concat502a和Concat502b用于对输入的向量进行拼接,具体地,Concat502a的输入是对非判决书进行分词处理得到的每个词对应的向量以及CNN501a输出的向量,CNN501a的输入为对应词的各个字对应的向量进行拼接后的向量,Concat502a输出的向量作为非判决书中每个词对应的目标向量。同样地,Concat502b的输入为对问题文本进行分词处理得到的每个词对应的向量以及CNN501b输出的向量,CNN501b的输入为对应词的各个字对应的向量进行拼接后的向量,Concat502b输出的向量作为问题文本中每个词对应的目标向量。将非判决书中每个词对应的目标向量输入BiLSTM双向LSTM503a,得到非判决书中每个词对应的、具有上下文信息的向量,同样地,将问题文本中每个词对应的目标向量输入BiLSTM503b,得到问题文本中每个词对应的、具有上下文信息的向量,将非判决书中每个词对应的具有上下文信息的向量和问题文本中每个词对应的具有上下文信息的向量输入Attention504,Attention504输出的向量为非判决书中每个词基于问题文本的表示,Attention504输出的向量输入BiLSTM505,BiLSTM505输出非判决书中每个词作为答案起始词的得分、答案结束词的得分和该词不属于答案的得分。步骤S402:通过目标量刑要素信息,确定目标非判决书中与指定量刑要素标签对应的量刑要素。需要说明的是,在某些时候,可能出现某个指定问题标签具有多个答案的情况,当出现这种情况时,可对指定问题标签对应的多个答案进行处理。具体的,将具有多个答案的指定问题标签作为目标问题标签,从目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案;若剩余答案为多个,则将多个剩余答案进行去重合并处理,去重合并处理后得到的答案作为与目标问题标签对应的指定量刑要素标签所对应的量刑要素。进一步地,请参阅图6,示出了从目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案的实现过程的流程示意图,该实现过程可以包括:步骤S601:从目标问题标签对应的多个答案中确定预设个答案组成第一候选答案集合。其中,每个答案的得分通过该答案的起始位置得分和结束位置得分确定。具体地,对于每个答案而言,可将该答案对应的起始位置得分与结束位置得分的乘积作为该答案的得分。其中,预设个答案的得分均高于其它答案的得分。在一种可能的实现方式中,可先筛选出得分最高的答案,然后将筛选出的该答案的起始位置得分与结束位置得分置0,接着再筛选得分最高的答案,将筛选出的该答案的起始位置得分与结束位置得分置0,以此类推,筛选出预设个答案。在另一种可能的实现方式中,可按得分由高到低的顺序对目标问题标签对应的多个答案进行排序,假设预设个为N比如5,则将排名前N的答案组成第一候选答案集合。需要说明的是,若目标问题标签对应的答案的数量大于预设个,则执行步骤S601,若目标问题标签对应的答案的数量小于或等于预设个,将目标问题标签对应的答案直接组成第一候选答案集合,然后执行步骤S402。步骤S602:将第一候选答案集合中得分低于第一阈值的候选答案去除,获得第二候选答案集合。其中,第一阈值为目标问题标签对应的答案为空的得分。示例性地,第一候选集合中包括5个答案,其中,有两个答案的得分均低于目标问题标签对应的答案为空的得分,则将这两个答案从第一候选答案集合中去除。需要说明的是,若第一候选答案集合中各个候选答案的得分均低于目标问题标签对应的答案为空的得分,则认为目标非判决书中没有与该目标问题标签对应的答案。步骤S603:将第二候选答案集合中得分低于第二阈值的非最高得分的候选答案去除,获得剩余答案。其中,第二阈值基于最高得分的候选答案的得分设定。示例性地,可设定第二阈值为最高得分的候选答案的得分的110,即如果第二候选答案集合中的某个候选答案的得分低于最高得分的候选答案的得分的110,则将该候选答案从第二候选答案集合中去除。在获得剩余答案后,若剩余答案有多个,可能存在多个剩余答案存在重合内容的情况,此时,需要将多个剩余答案进行去重合并处理,去重合并处理后得到的答案作为与目标问题标签对应的目标答案,即为与目标问题标签对应的指定量刑要素标签所对应的量刑要素。示例性地,目标问题标签对应的答案有多个,从目标问题标签对应的多个答案中去除不满足预设条件的答案,获得的剩余答案包括3个,3个答案分别为:1弟弟:XXX,37岁,在原籍务农,妹妹:XXX,35岁;2妹妹:XXX,35岁,现在原籍经商;3儿子:XXX,12岁,离婚后归前妻抚养,由于第一个答案与第二个答案之间有重合内容:妹妹:XXX,35岁,则需要将该重合内容去除,去除重合内容后得到:1弟弟:XXX,37岁,在原籍务农;2妹妹:XXX,35岁,现在原籍经商;3儿子:XXX,12岁,离婚后归前妻抚养。本申请实施例提供的量刑结果预测方法,可利用少量标注有指定量刑要素标签和指定判决结果要素标签的判决书训练判决书要素抽取模型,然后用训练得到的判决书要素抽取模型从未标注判决书中抽取与指定量刑要素标签对应的量刑要素以及与指定判决结果要素标签对应的判决结果要素,接着用判决书要素抽取模型从未标注判决书中抽取的数据训练量刑结果预测模型,最后从指定案件的目标非判决书中抽取与指定量刑要素标签对应的目标量刑要素,将目标量刑要素输入训练得到的量刑结果预测模型,从而获得量刑结果预测模型输出的、指定案件的量刑结果。本申请提供的量刑结果预测方法,基于法律文书的内在特征和少量人工标注的法律文书就可达到较好的辅助量刑效果,克服了现有预测方案人工介入过多且辅助量刑效果较差的问题。与上述量刑结果预测方法相对应,本申请实施例还提供了一种量刑结果预测装置,该装置可以包括:非判决书获取模块701、量刑要素确定模块702和量刑结果预测模块703。非判决书获取模块701,用于获取指定罪名的指定案件的非判决书,作为目标非判决书。量刑要素确定模块702,用于从目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素。量刑结果预测模块703,用于将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的指定案件的量刑结果。其中,量刑结果预测模型以从指定罪名的训练判决书中抽取的、与指定量刑要素标签对应的量刑要素为训练样本,以从训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。本申请实施例提供的量刑结果预测装置,首先获取指定罪名的指定案件的目标非判决书,然后从目标非判决书中获取与指定量刑要素标签对应的目标量刑要素,最后将目标量刑要素输入预先建立的量刑结果预测模型,获得量刑结果预测模型输出的指定案件的量刑结果。本申请实施例提供的量刑结果预测装置可基于指定案件的非判决书,利用预先建立的量刑结果预测模型自动预测出量刑结果,且预测出的量刑结果比较准确,该量刑结果可供法官参考,具有较好的辅助量刑效果。上述实施例提供的量刑结果预测装置还可以包括:判决书要素抽取模块。判决书要素抽取模块,用于利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素。其中,所述判决书要素抽取模型以标注有指定量刑要素标签和指定判决结果要素标签的训练判决书进行训练得到。进一步地,上述的判决书要素抽取模块,具体用于通过所述判决书要素抽取模型中的语义向量确定模块,对所述未标注判决书进行分词处理,确定分词处理得到的每个词对应的语义向量;通过所述判决书要素抽取模型中的要素标签确定模块和所述每个词对应的语义向量,确定与每个语义向量对应的词的要素标签;将要素标签相同的连续多个词合并,合并后的内容作为该要素标签对应的要素。在一种可能的实现方式中,上述实施例提供的量刑要素确定模块702,具体用于利用预先建立的非判决书要素抽取模型,从所述目标非判决书中抽取与所述指定量刑要素标签对应的量刑要素。其中,所述非判决书要素抽取模型以训练非判决书为训练样本,以基于所述指定量刑要素标签对所述训练非判决书进行标注的标注结果为样本标签进行训练得到。在一种可能的实现方式中基于所述指定量刑要素标签对所述非判决书进行标注的标注结果包括:所述训练非判决书中与所述指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及,量刑要素为空的得分。则量刑要素确定模块702包括:量刑要素信息确定子模块和量刑要素确定子模块。量刑要素信息确定子模块,用于通过所述非判决书要素抽取模型确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的信息作为目标量刑要素信息。所述目标量刑要素信息包括:所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及量刑要素为空的得分。量刑要素确定子模块,用于通过所述目标量刑要素信息,确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素。进一步地,量刑要素信息确定子模块,具体用于将所述目标非判决书和问题标签文本,输入所述非判决书要素抽取模型,获得所述非判决书要素抽取模型输出的目标答案信息,作为所述目标量刑要素信息。其中,问题标签文本为包含指定问题标签的文本,所述指定问题标签为将所述指定量刑要素标签转换为问题形式后的标签;所述目标答案信息包括与所述指定问题标签对应的答案的起始位置和起始位置得分、结束位置和结束位置得分,以及,答案为空的得分。进一步地,量刑要素确定子模块,具体用于若所述指定问题标签中存在具有多个答案的目标问题标签,则从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案;若所述剩余答案为多个,则将多个所述剩余答案进行去重合并处理,去重合并处理后得到的答案作为所述目标量刑要素。更进一步地,量刑要素确定子模块在从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案时,具体用于从所述目标问题标签对应的多个答案中确定预设个答案组成第一候选答案集合,其中,所述预设个答案的得分均高于其它答案的得分,每个答案的得分通过该答案的起始位置得分和结束位置得分确定;将所述第一候选答案集合中得分低于第一阈值的候选答案去除,获得第二候选答案集合,其中,所述第一阈值为所述目标问题标签对应的答案为空的得分;将所述第二候选答案集合中得分低于第二阈值的非最高得分的候选答案去除,获得所述剩余答案,其中,所述第二阈值基于所述最高得分的候选答案的得分设定。量刑要素确定子模块,还用于当所述第一候选答案集合中各个候选答案的得分均低于所述第一阈值时,确定所述目标问题标签对应的答案为空。本申请实施例还提供了一种量刑结果预测设备,请参阅图7,示出了该量刑结果预测设备的结构示意图,其可以包括:存储器801和处理器802。存储器801,用于存储程序;处理器802,用于执行所述程序,所述程序具体用于:获取指定罪名的非判决书,作为目标非判决书;从所述目标非判决书中获取指定量刑要素标签对应的量刑要素,作为目标量刑要素;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。量刑结果预测设备还可以包括:总线、通信接口803、输入设备804和输出设备805。处理器802、存储器801、通信接口803、输入设备804和输出设备805通过总线相互连接。其中:总线可包括一通路,在计算机系统各个部件之间传送信息。处理器1102可以是通用处理器,例如通用中央处理器CPU、微处理器等,也可以是特定应用集成电路application-specificintegratedcircuit,ASIC,或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器DSP、专用集成电路ASIC、现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。处理器802可包括主处理器,还可包括基带芯片、调制解调器等。存储器801中保存有执行本发明技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器801可以包括只读存储器read-onlymemory,ROM、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器randomaccessmemory,RAM、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。输入设备804可包括接收用户输入的数据和信息的装置,例如摄像头、光笔、触摸屏等。输出设备805可包括允许输出信息给用户的装置,例如显示屏、扬声器等。通信接口803可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网RAN,无线局域网WLAN等。处理器802执行存储器801中所存放的程序,以及调用其他设备,可用于实现本发明实施例所提供的量刑结果预测方法的各个步骤。本申请实施例还提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述实施例提供的量刑结果预测方法的各个步骤。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备可以是个人计算机,服务器,或者网络设备等执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器ROM,Read-OnlyMemory、随机存取存储器RAM,RandomAccessMemory、磁碟或者光盘等各种可以存储程序代码的介质。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

权利要求:1.一种量刑结果预测方法,其特征在于,包括:获取指定罪名的指定案件的非判决书,作为目标非判决书;从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。2.根据权利要求1所述的量刑结果预测方法,其特征在于,所述从所述指定罪名的训练判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素的过程包括:利用预先建立的判决书要素抽取模型,从未标注判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素;其中,所述判决书要素抽取模型以标注有指定量刑要素标签和指定判决结果要素标签的训练判决书进行训练得到。3.根据权利要求2所述的量刑结果预测方法,其特征在于,所述利用预先建立的判决书要素抽取模型,从所述未标注判决书中抽取与所述指定量刑要素标签对应的量刑要素以及与所述指定判决结果要素标签对应的判决结果要素,包括:通过所述判决书要素抽取模型中的语义向量确定模块,对所述未标注判决书进行分词处理,确定分词处理得到的每个词对应的语义向量;通过所述判决书要素抽取模型中的要素标签确定模块和所述每个词对应的语义向量,确定与每个语义向量对应的词的要素标签;将要素标签相同的连续多个词合并,合并后的内容作为该要素标签对应的要素。4.根据权利要求1所述的量刑结果预测方法,其特征在于,所述从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,包括:利用预先建立的非判决书要素抽取模型,从所述目标非判决书中抽取与所述指定量刑要素标签对应的量刑要素;其中,所述非判决书要素抽取模型以训练非判决书为训练样本,以基于所述指定量刑要素标签对所述训练非判决书进行标注的标注结果为样本标签进行训练得到。5.根据权利要求4所述的量刑结果预测方法,其特征在于,所述基于所述指定量刑要素标签对所述非判决书进行标注的标注结果包括:所述训练非判决书中与所述指定量型要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及,量刑要素为空的得分。6.根据权利要求5所述的量刑结果预测方法,其特征在于,所述利用预先建立的非判决书要素抽取模型,从所述目标非判决书中抽取与所述指定量刑要素标签对应的量刑要素,包括:通过所述非判决书要素抽取模型确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的信息作为目标量刑要素信息,所述目标量刑要素信息包括所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的起始位置和起始位置得分、结束位置和结束位置得分,以及量刑要素为空的得分;通过所述目标量刑要素信息,确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素。7.根据权利要求6所述的量刑结果预测方法,其特征在于,所述通过所述非判决书要素抽取模型确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素的信息作为目标量刑要素信息,包括:将所述目标非判决书和问题标签文本,输入所述非判决书要素抽取模型,获得所述非判决书要素抽取模型输出的目标答案信息,作为所述目标量刑要素信息;其中,问题标签文本为包含指定问题标签的文本,所述指定问题标签为将所述指定量刑要素标签转换为问题形式后的标签;所述目标答案信息包括与所述指定问题标签对应的答案的起始位置和起始位置得分、结束位置和结束位置得分,以及,答案为空的得分。8.根据权利要求7所述的量刑结果预测方法,其特征在于,所述通过所述目标量刑要素信息,确定所述目标非判决书中与所述指定量刑要素标签对应的量刑要素,包括:若所述指定问题标签中存在具有多个答案的目标问题标签,则从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案;若所述剩余答案为多个,则将多个所述剩余答案进行去重合并处理,去重合并处理后得到的答案作为所述目标量刑要素。9.根据权利要求7所述的量刑结果预测方法,其特征在于,所述从所述目标问题标签对应的多个答案中去除不满足预设条件的答案,获得剩余答案,包括:从所述目标问题标签对应的多个答案中确定预设个答案组成第一候选答案集合,其中,所述预设个答案的得分均高于其它答案的得分,每个答案的得分通过该答案的起始位置得分和结束位置得分确定;将所述第一候选答案集合中得分低于第一阈值的候选答案去除,获得第二候选答案集合,其中,所述第一阈值为所述目标问题标签对应的答案为空的得分;将所述第二候选答案集合中得分低于第二阈值的非最高得分的候选答案去除,获得所述剩余答案,其中,所述第二阈值基于所述最高得分的候选答案的得分设定。10.根据权利要求9所述的量刑结果预测方法,其特征在于,所述从所述目标问题标签对应的多个答案中滤除不满足预设条件的答案,获得剩余答案,还包括:若所述第一候选答案集合中各个候选答案的得分均低于所述第一阈值,则确定所述目标问题标签对应的答案为空。11.一种量刑结果预测装置,其特征在于,包括:非判决书获取模块、量刑要素确定模块和量刑结果预测模块;所述非判决书获取模块,用于获取指定罪名的指定案件的非判决书,作为目标非判决书;所述量刑要素确定模块,用于从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;所述量刑结果预测模块,用于将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。12.一种量刑结果预测设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,所述程序具体用于:获取指定罪名的指定案件的非判决书,作为目标非判决书;从所述目标非判决书中获取与指定量刑要素标签对应的量刑要素,作为目标量刑要素;将所述目标量刑要素输入预先建立的量刑结果预测模型,获得所述量刑结果预测模型输出的所述指定案件的量刑结果;其中,所述量刑结果预测模型以从所述指定罪名的训练判决书中抽取的、与所述指定量刑要素标签对应的量刑要素为训练样本,以从所述训练判决书中抽取的、与指定判决结果要素标签对应的判决结果要素为样本标签进行训练得到。13.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至10中任一项所述的量刑结果预测方法的各个步骤。

百度查询: 讯飞智元信息科技有限公司 一种量刑结果预测方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。