买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】裁决结果分析方法、装置、计算机设备和存储介质_平安科技(深圳)有限公司_201910520122.6 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-06-17

公开(公告)日:2024-01-05

公开(公告)号:CN110377618B

主分类号:G06F16/245

分类号:G06F16/245;G06F16/33;G06F16/332;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.01.05#授权;2021.07.06#实质审查的生效;2019.10.25#公开

摘要:本申请涉及一种基于机器学习的裁决结果分析方法、装置、计算机设备和存储介质。该方法包括:接收终端发送的第一裁决分析请求;第一裁决分析请求包含案件标识;根据案件标识,获取当前案件对应的案件信息;基于案件信息生成当前案件的特征向量;将特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将分析维度表达式及分析条件表达式填充至第一SQL模板,得到第一检索分析语句;基于第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对近似案件的裁决结果进行统计分析,得到第一分析结果,将第一分析结果返回至终端。采用本方法能够提高案件信息处理效率。

主权项:1.一种裁决结果分析方法,所述方法包括:接收终端发送的第一裁决分析请求;所述第一裁决分析请求包含案件标识;根据所述案件标识,获取当前案件对应的案件信息;基于所述案件信息生成当前案件的特征向量,包括调用预设模型识别所述案件信息中的因子描述语句,计算所述因子描述语句与预设的多个模板描述语句的相似度,获取所述相似度超过阈值的模板描述语句关联的参考因子值,根据所述参考因子值确定所述当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算所述当前案件的特征向量;将所述特征向量输入预设的序列模型,得到分析维度表达式,包括:所述序列模型包括编码器、解码器和注意力模块;案件统计表包括多个字段枚举值;调用所述编码器对所述特征向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用所述解码器对所述压缩向量对解码处理,得到每个所述字段枚举值对应的初始匹配概率;调用所述注意力模块对所述压缩向量进行注意力训练,得到每个所述字段枚举值对应的相似度加权;根据所述相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个所述字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成所述分析维度表达式;获取分析条件表达式及第一SQL模板,将所述分析维度表达式及所述分析条件表达式填充至所述第一SQL模板,得到第一检索分析语句;基于所述第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对所述近似案件的裁决结果进行统计分析,得到第一分析结果,将所述第一分析结果返回至所述终端。

全文数据:裁决结果分析方法、装置、计算机设备和存储介质技术领域本申请涉及计算机技术领域,特别是涉及一种裁决结果分析方法、装置、计算机设备和存储介质。背景技术在案件审理过程中,法官和律师需要对当前案件进行裁决处理,并作出裁决决定。裁决决定是指仲裁庭在认定证据、查明事实的基础上,依法对当事人提出的仲裁请求或反请求及其相关事项作出决定的具有法律效力的裁决结果。然而,传统方式由于难以准确高效的向法官和律师提供参考信息,使得裁决决定的作出完全依赖法官和律师的处理经验,降低了裁决结果生成效率。发明内容基于此,有必要针对上述技术问题,提供一种能够向用户反馈法院对以往近似案件的处理情况作为参考,以辅助其作出当前案件的裁决决定,从而提高案件处理效率的裁决结果分析方法、装置、计算机设备和存储介质。一种裁决结果分析方法,所述方法包括:接收终端发送的第一裁决分析请求;所述第一裁决分析请求包含案件标识;根据所述案件标识,获取当前案件对应的案件信息;基于所述案件信息生成当前案件的特征向量;将所述特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将所述分析维度表达式及所述分析条件表达式填充至所述第一SQL模板,得到第一检索分析语句;基于所述第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对所述近似案件的裁决结果进行统计分析,得到第一分析结果,将所述第一分析结果返回至所述终端。在一个实施例中,所述基于所述案件信息生成当前案件的特征向量,包括:根据预设的多个目标因子,识别所述案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;否则,调用预设模型识别所述案件信息中的因子描述语句,计算所述因子描述语句与预设的多个模板描述语句的相似度,获取所述相似度超过阈值的模板描述语句关联的参考因子值,根据所述参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。在一个实施例中,所述序列模型包括编码器、解码器和注意力模块;所述案件统计表包括多个字段枚举值;所述将所述特征向量输入预设的序列模型,得到分析维度表达式,包括:调用所述编码器对所述特征向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用所述解码器对所述压缩向量对解码处理,得到每个所述字段枚举值对应的初始匹配概率;调用所述注意力模块对所述压缩向量进行注意力训练,得到每个所述字段枚举值对应的相似度加权;根据所述相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个所述字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。在一个实施例中,所述将所述第一分析结果返回至所述终端,包括:获取第一图表模板,根据所述第一图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在所述第一分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及分别对应的坐标元素和坐标值构建第一分析图表;根据第一分析结果生成当前案件的建议裁决结果,并计算所述建议裁决结果的置信度;将所述第一分析图表、建议裁决结果及对应的置信度发送至所述终端。在一个实施例中,所述方法还包括:接收终端发送的第二裁决分析请求;所述第二裁决分析请求携带了检索分析语句;获取所述案件统计表的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到第二SQL模板;将所述分析意图表达式填充至所述第二SQL模板,得到第二检索分析语句;基于所述第二检索分析语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将得到的第二分析结果返回至所述终端。在一个实施例中,所述表信息包括多个字段枚举值;所述根据所述检索分析语句及所述表信息,生成目标向量,包括:对所述检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个所述字段枚举值对应的词向量,记作第二向量;计算所述第一向量与不同第二向量的相似度;将所述第一向量与相似度最高的第二向量进行拼接,得到所述目标向量。一种裁决结果分析装置,所述装置包括:案件特征提取模块,用于接收终端发送的第一裁决分析请求;所述第一裁决分析请求包含案件标识;根据所述案件标识,获取当前案件对应的案件信息;基于所述案件信息生成当前案件的特征向量;检索分析语句生成模块,用于将所述特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将所述分析维度表达式及所述分析条件表达式填充至所述第一SQL模板,得到第一检索分析语句;裁决统计分析模块,用于基于所述第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对所述近似案件的裁决结果进行统计分析,得到第一分析结果,将所述第一分析结果返回至所述终端。在一个实施例中,所述案件特征提取模块还用于根据预设的多个目标因子,识别所述案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;否则,调用预设模型识别所述案件信息中的因子描述语句,计算所述因子描述语句与预设的多个模板描述语句的相似度,获取所述相似度超过阈值的模板描述语句关联的参考因子值,根据所述参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的裁决结果分析方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的裁决结果分析方法的步骤。上述裁决结果分析方法、装置、计算机设备和存储介质,由于用户只需简单提供一个案件标识,即可自行解构当前案件的案件信息,简化输入操作,可以提高裁决分析效率;不仅基于解构得到的案件信息自动准确识别当前案件的案件特征,还基于预置的序列模型和第一SQL模板自动将案件特征转化为SQL形式的检索分析语句,大大减少人工参与,实现真正意义上的端到端的裁决分析;结合预先解构的案件统计表,可以进一步提高裁决分析效率。附图说明图1为一个实施例中种裁决结果分析方法的应用场景图;图2为一个实施例中种裁决结果分析方法的流程示意图;图3为一个实施例中种基于自然语言的裁决分析的步骤的流程示意图;图4为一个实施例中种裁决结果分析装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的裁决结果分析方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当用户需要进行基于当前案件进行检索分析时,可以通过终端102向服务器104发送第一裁决分析请求。第一裁决分析请求携带了当前案件的案件标识。服务器104根据案件标识获取当前案件的案件信息。服务器104在案件信息中提取能够表征当前案件不同维度特征的案件因子,基于提取得到的案件因子构建当前案件的特征向量。服务器104基于历史案件的案件信息预先训练得到了序列模型,用于将特征向量与案件统计表中不同字段枚举值对应词向量进行匹配,并根据相匹配的字段枚举值生成当前案件的分析维度表达式。服务器104将特征向量输入序列模型,得到多个分析维度表达式。服务器104针对第一裁决分析请求对应的第一分析模式,预置了对应的分析条件表达式和第一SQL模板。服务器104将分析维度表达式及分析条件表达式填充至第一SQL模板,得到第一检索分析语句。服务器104基于第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对近似案件的裁决结果进行统计分析,得到第一分析结果,将第一分析结果返回至终端102,使用户根据第一分析结果了解以往近似案件的裁决意见倾向后,作出对当前案件的裁决决定。上述裁决结果分析过程,不仅基于解构得到的案件信息自动准确识别当前案件的案件特征,还基于预置的序列模型和第一SQL模板自动将案件特征转化为SQL形式的检索分析语句,结合预先解构的案件统计表,可以提高裁决分析效率。在一个实施例中,如图2所示,提供了一种裁决结果分析方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤202,接收终端发送的第一裁决分析请求;第一裁决分析请求包含案件标识。当用户对当前案件进行裁决处理时,若需要参考近似案件或相关案件的案件处理情况可以通过终端向服务器发送裁决分析请求。裁决分析请求包括第一裁决分析请求和第二裁决分析请求,分别用于实现不同的检索分析模式。其中,第一裁决分析请求用于实现第一模式。第一模式对当前案件的近似案件的裁决结果进行统计分析,是一种基于当前案件信息的针对性检索分析模式。第二裁决分析请求用于实现第二模式。第二模式根据用户输入的检索分析语句识别检索分析意图,对符合检索分析意图的相关案件的案件信息进行统计,是一种基于检索分析语句的概括性检索分析模式。步骤204,根据案件标识,获取当前案件对应的案件信息。当接收到终端发送的第一裁决分析请求时,服务器根据案件标识从案件处理平台对应的数据库拉取相应案件的案件信息。本实施例服务器与案件处理平台直接实现数据对接。若尚未实现数据对接,用户可以通过终端将当前案件的案件信息提交至服务器。步骤206,基于案件信息生成当前案件的特征向量。服务器从案件信息中提取能够表征当前案件不同维度特征的案件因子,如争议焦点类型、案由、地域、法律关系等。服务器基于提取得到的案件因子构建当前案件的特征向量。特征向量可以是每个案件因子对应的词向量。容易理解,当前案件可能对应有多个特征向量。步骤208,将特征向量输入预设的序列模型,得到分析维度表达式。预先对大量历史案件的案件文件解构,并利用解构的案件信息构建案件统计表。案件统计表记录了多个历史案件的案件信息。如下表1所示,案件信息可以包括从案件文件中解构得到的案件标识和多个案件因子。案件文件可以是历史案件的诉讼请求书、裁决文书等。案件因子可以是历史案件的裁决结果、年利率、主体、地域、裁判时间、法院层级或案由等。表1为了保证检索分析的准确性,案件统计表可以是动态更新的。基于案件统计表可以快速响应用户不同的检索分析意图。检索分析意图是指用户期望对案件统计表中哪些维度的案件信息进行哪方面的统计分析,包括分析维度意图和分析条件意图。服务器基于大量真实的历史案件的案件信息预先训练了序列模型。序列模型包括维度序列模型和条件序列模型。维度序列模型与条件序列模型分别可以是不同的RNN模型,如LSTMLongShort-TermMemory,长短期记忆网络等。其中,维度序列模型用于识别用户的分析维度意图;条件序列模型用于识别用户的分析条件意图。第一模式默认的分析条件意图为法院对以往近似案件的裁决意见倾向。换言之,第一模式的分析条件表达式记作“第一条件表达式”可以是固定的,如“意图=支持比例”。支持比例可以是裁决结果为支持的案件数量与裁决结果为不支持的案件数量的比值。服务器按照上述计算案件统计表中每个字段枚举值的词向量。在另一个实施例中,词向量可以服务器预先计算并记录在案件统计表中的,可以提高向量匹配效率,进而提高检索分析效率。服务器计算特征向量与案件统计表中不同词向量的相似度;将特征向量与相似度最高的词向量进行拼接,得到目标向量。在第一模式中,服务器将当前案件的目标向量输入维度序列模型,输出得到当前案件的多个分析维度表达式记作“第一维度表达式”,如“案由=金融借款纠纷”、“地域=广东*”、“法律关系=担保关系”等。步骤210,获取分析条件表达式及第一SQL模板,将分析维度表达式及分析条件表达式填充至第一SQL模板,得到第一检索分析语句。服务器预置了多种SQL模板。不同的SQL模板用于满足用户基于不同维度和条件的检索分析意图。服务器训练训练了意图分类模型。意图分类模型用于根据当前用户检索分析意图确定选用哪种SQL模板。第一模式默认的SQL模板为第一SQL模板,无需通过意图分类模型选定。不同的SQL模板的填充方式可以不同。服务器按照第一SQL模板的填充方式将第一维度表达式和第一条件表达式填充至第一SQL模板,即可得到第一检索分析语句。步骤212,基于第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对近似案件的裁决结果进行统计分析,得到第一分析结果,将第一分析结果返回至终端。基于第一检索分析语句不仅可以实现地域、案由、法律关系等多个维度的数据查询;还可以实现案件支持比例的数据统计。由于是基于当前案件多个维度的案件因子进行案件查询,可以将查询到的历史案件记作当前案件的近似案件。基于近似案件进行支持比例统计,可以提高第一分析结果参考价值,即提高第一分析结果准确性。在另一个实施例中,若近似案件有多个,服务器计算每个近似案件与当前案件的近似度,获取每个近似案件的案件摘要,根据近似度对多个案件摘要进行排序;将排序后的多个近似案件的案件摘要也一并返回至终端,以便用户对相似度高的近似案件的案件文书做进一步详细参考。本实施例中,根据终端发送的第一裁决分析请求,可以获取当前案件的案件信息;基于案件信息,可以生成当前案件的特征向量;将特征向量输入预设的序列模型,可以得到多个分析维度表达式;基于预设的分析条件表达式及第一SQL模板,并将分析维度表达式及分析条件表达式填充至第一SQL模板,可以得到第一检索分析语句;基于第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对近似案件的裁决结果进行统计分析,可以得到第一分析结果,进而可以将第一分析结果返回至终端。由于用户只需简单提供一个案件标识,即可自行解构当前案件的案件信息,简化输入操作,可以提高裁决分析效率;不仅基于解构得到的案件信息自动准确识别当前案件的案件特征,还基于预置的序列模型和第一SQL模板自动将案件特征转化为SQL形式的检索分析语句,大大减少人工参与,实现真正意义上的端到端的裁决分析;结合预先解构的案件统计表,可以进一步提高裁决分析效率。在一个实施例中,基于案件信息生成当前案件的特征向量,包括:根据预设的多个目标因子,识别案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;否则,调用预设模型识别案件信息中的因子描述语句,计算因子描述语句与预设的多个模板描述语句的相似度,获取相似度超过阈值的模板描述语句关联的参考因子值,根据参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。目标因子是指需要获取对应因子值的案件因子。不同案件因子的因子值的提取方式可以不同。对于在案件文件中直接明文记载的信息内容,可以利用关键词匹配或者正则匹配即可得到对应案件因子的因子值,如裁判时间。而对于在案件文件中没有明文记载在案件因子的因子值,则需要基于预先训练的语义理解模型进行提炼,如争议焦点类型、法院观点等。具体的,根据专家规则提供的多种关键词集合,服务器预置了多种正则表达式。不同正则表达式用于识别案件文件中的不同目标因子对应的相关描述语句记作因子描述语句。服务器计算因子描述语句的表征向量,记作因子向量。服务器预存储了每种目标因子对应的一个或多个模板描述语句。服务器计算相应目标因子对应模板描述语句的表征向量,记作参考向量。服务器通过计算两个向量的欧氏距离、余弦相似度等,得到因子向量与每个参考向量的相似度。每个模板描述语句关联有对应的参考因子值。服务器可以将参考因子值直接作为当前案件相应目标因子的因子值,也可以对参考因子值作预设逻辑运算,将预设逻辑运算结果作为当前案件相应目标因子的因子值。例如,将参考因子值输入预设公式,将预设公式的输出作为前案件相应目标因子的因子值。本实施例中,基于预置的大量正则表达式及语义理解模型可以自动提取案件信息中目标因子的因子值,减少人工参与,提高案件特征提取效率,进而提高裁决信息检索分析效率。在一个实施例中,序列模型包括编码器、解码器和注意力模块;案件统计表包括多个字段枚举值;将特征向量输入预设的序列模型,得到分析维度表达式,包括:调用编码器对特征向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用解码器对压缩向量对解码处理,得到每个字段枚举值对应的初始匹配概率;调用注意力模块对压缩向量进行注意力训练,得到每个字段枚举值对应的相似度加权;根据相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。在一个实施例中,将第一分析结果返回至终端,包括:获取第一图表模板,根据第一图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在第一分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及分别对应的坐标元素和坐标值构建第一分析图表;根据第一分析结果生成当前案件的建议裁决结果,并计算建议裁决结果的置信度;将第一分析图表、建议裁决结果及对应的置信度发送至终端。服务器预置了多种图表模板。图表模板的图表类型可以是折线图、柱状图、雷达图等。每种图表模板关联了对应的坐标提取规则。根据坐标提取规则,可以在分析结果中提取得到多个基础坐标及每个基础坐标对应的坐标元素和坐标值。本实施例在第一模式下可以默认选用第一图表模板;在第二模式下可以根据不同检索分析意图可以选用不同的图表模板。比如,检索分析语句“2018年广东地区合同解除纠纷类案件的比例”对应的目标图表类型可以是柱状图。其中,横坐标为合同解除结果,坐标元素为离散值“解除”和“不解除”两个;纵坐标为案件比例,坐标元素为连续值0~100%。在另一个实施例中,还预设每个分析图表对应的备选图表类型,可以支持对图表类型一键变更。同时提供多个备选图表类型的选项,可以在保证分析结果反馈效率的同时,极大的满足用户的个性化需求。在又一个实施例中,还支持用户对分析图表中图表元素进行变更。具体的,服务器接收终端发送的对分析图表的调整请求。调整请求携带了对分析图表中一个或多个图元的变更信息。服务器根据变更信息将分析图表中相应图元进行新增、删除或变更显示位置等处理。通过调整分析图表,方便用户在原始检索结果的基础上作进一步深度检索。建议裁决结果可以根据第一分析结果生成的。服务器还计算建议裁决结果的置信度。置信度可以是基于多个近似案件分别与当前案件的近似度的平均值计算得到。建议裁决结果及对应置信度可以是以自然语言的方式展示的一个或多个语句,如“鉴于有75%的近似案件得到支持,建议裁决结果为支持,且置信度为66%”。本实施例中,以图表的方式可视化展示分析结果,使得分析结果更加直观。在给出分析结果的同时,提供具体的建议裁决结果及置信度,便于用户更加快速准确的作出裁决决定,从而可以提高案件信息处理效率。在一个实施例中,如图3所示,该方法还包括基于自然语言的裁决分析的步骤,具体包括:步骤302,接收终端发送的第二裁决分析请求;第二裁决分析请求携带了检索分析语句。在第二模式下,支持用户以自然语言的形式进行检索分析。检索分析语句可以是自然语言形成的一个或多个短句。例如,“金融借款类案件在广东地区的支持率”、“2018年广东地区合同解除纠纷类案件的比重”、“涉及借贷纠纷的案子一般都分布在哪儿”等。检索分析语句可能是存在语法错误,语义不连贯的语句。例如,“近五年贷款逾期还款的判案趋势,比如广东法院”等。对于存在语法错误,语义不连贯的检索分析语句,服务器对检索分析语句进行语义分析,生成对应的一种或多种语义连贯的检索意图语句,并基于检索意图语句生成检索意图确认提示,将检索意图确认提示返回至终端。用户可以基于检索意图确认提示选定一个检索意图语句,终端将选定信息发送至服务器。服务器按照本实施例提供的方法基于用户选定检索意图语句进行检索分析。在另一个实施例中,检索分析语句也可以是多个检索字段,对此不做限制。步骤304,获取案件统计表的表信息。服务器获取案件统计表的表信息。表信息包括表名、多个表头以及每个表头对应的多个字段枚举值。每个表头可以是一种案件因子。例如,表1中第一行的每个字段即为一个表头,每一列其余行的多个字段即为相应表头对应的多个字段枚举值,如“广东深圳”、“上海”分别为表头“地域”的字段枚举值。步骤306,根据检索分析语句及表信息,生成目标向量。在一个实施例中,表信息包括多个字段枚举值;根据检索分析语句及表信息,生成目标向量,包括:对检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个字段枚举值对应的词向量,记作第二向量;计算第一向量与不同第二向量的相似度;将第一向量与相似度最高的第二向量进行拼接,得到目标向量。服务器对检索分析语句进行分词,并对得到的多个分词进行去停用词和同义词替换等优化处理。服务器对优化处理后的每个分词进行One-hot独热编码,得到每个分词对应的第一向量。服务器基于word2vec等算法计算案件统计表中每个字段枚举值对应的词向量,记作第二向量。服务器计算第一向量与不同第二向量的相似度;将第一向量与相似度最高且达到阈值的第二向量进行拼接,得到目标向量。将第一向量与相似度高的第二向量拼接,可以使用户的检索意图特征更加明显,提高模型识别精度。步骤308,将目标向量输入预设的序列模型,得到分析意图表达式。与第一模式不同,基于检索分析语句的分许维度和分析条件是多变的,需要基于序列模型动态确定。服务器调用条件序列模型对目标向量中包含分析维度信息的局部向量进行遗忘处理,得到一个或多个分析条件表达式记作第二条件表达式。维度序列模型包括编码器、解码器和注意力模块。其中,编码器、解码器及注意力模块亦可以分别为不同的RNN模型。编码器用于对检索分析语句进行编码,即对对应多个目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个压缩向量。压缩向量蕴含了检索分析语句的语句含义。解码器用于对压缩向量进行降维处理,并基于降维后的压缩向量映射计算目标向量与每个字段枚举值的初始匹配概率。注意力模块用于对降维后的压缩向量进行注意力训练,计算目标向量与每个字段枚举值对应的相似度加权。解码器还用于根据相似度加权对目标向量与相应字段枚举值的初始匹配概率进行调整,得到每个目标向量与不同字段枚举值的目标匹配概率。服务器基于目标匹配概率最高的字段枚举值生成相应目标向量对应的分析维度表达式记作第二维度表达式。例如,将目标匹配概率最高的字段枚举值所对应的表头作为Key值,将目标匹配概率最高的字段枚举值或对目标匹配概率最高的字段枚举值转换后作为Value值,构成的Key-Value键值对可以作为第二维度表达式。其中,对目标匹配概率最高的字段枚举值的转换处理可以是将字段枚举值中的部分字段以*等指定字符替换。例如,用户基于检索分析语句“2018年广东地区合同解除纠纷类案件的比重”的检索分析意图是仅对广东地区的案件进行统计,而案件统计表中并没有一个字段枚举值为“广东”,则可以将目标匹配概率最高的字段枚举值“广东深圳”转换为“广东*”。步骤310,将目标向量输入预设的意图分类模型,得到第二SQL模板。服务器将检索分析语句对应的多个目标向量依次输入意图分类模型,得到目标SQL模板,记作第二SQL模板。意图分类模型可以是基于大量模拟的检索分析语句以及每个检索分析语句对应标注的目标SQL模板,对基础分类模型进行有监督训练得到的。基础训练模型可以是RNN模型Recurrentneuralnetwork,循环神经网络模型。步骤312,将分析意图表达式填充至第二SQL模板,得到第二检索分析语句。服务器按照第二SQL模板的填充方式将第二条件表达式和第二维度表达式填充至第二SQL模板,即可得到第二检索分析语句。在另一个实施例中,将第二条件表达式和第二维度表达式记作分析意图表达式。序列模型还输出每个分析意图表达式对应的意图强度,根据意图强度对多个分析意图表达式进行排序,根据排序将多个分析意图表达式填充至目标第二SQL模板,得到第二检索分析语句。在又一个实施例中,每个分析意图表达式在检索分析语句具有对应的意图表达分词,例如,检索分析语句“涉及借贷纠纷的案子一般都分布在哪儿”中,分析意图表达式“案由=*借贷纠纷OR*借款纠纷”对应的意图表达分词可以是“借贷纠纷”,“意图=地域”对应的意图表达分词可以是“在哪儿”。服务器根据意图表达式对应意图表达分词在检索分析语句中出现的顺序,依次将多个分析意图表达式填充至第二SQL模板。步骤314,基于第二检索分析语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,将得到的第二分析结果返回至终端。基于不同第二检索分析语句不仅可以实现裁判时间、地域、案由等不同维度的数据查询;还可以实现案件比重、案件数量、支持率等不同条件的数据统计。服务器基于第二检索分析语句在案件统计表中进行数据查询和统计分析,将第二分析结果返回至终端。对于以往相关案件的案件处理信息查询,传统方式直接通过预置词表的方式粗狂的断定用户检索意图,且不支持用户以自然语言的方式进行检索。此外,预置词表不仅需要花费大量的人力,且难以保证词表信息的覆盖率,一旦用户输入的某个检索关键词在词表中没有覆盖到,则检索分析失败。而本实施例,支持用户以自然语言的方式进行检索。容易理解,自然语言相比单独的检索关键词可以更加准确的表达用户的检索意图,从而基于检索分析语句可以更加准确的挖掘用户的检索分析意图。本申请还通过机器学习预先训练序列模型和意图分类模型,可以进一步快速准确识别用户的检索分析意图,相比预置词表可以减少人工参与,实现真正意义上端到端的裁决信息检索分析。结合预先解构的案件统计表,可以提高裁决信息检索分析效率,进而可以快速响应用户不同的检索分析意图。应该理解的是,虽然图2~图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2~图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图4所示,提供了一种裁决结果分析装置,包括:案件特征提取模块402、检索分析语句生成模块404和裁决统计分析模块406,其中:案件特征提取模块402,用于接收终端发送的第一裁决分析请求;第一裁决分析请求包含案件标识;根据案件标识,获取当前案件对应的案件信息;基于案件信息生成当前案件的特征向量。检索分析语句生成模块404,用于将特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将分析维度表达式及分析条件表达式填充至第一SQL模板,得到第一检索分析语句。裁决统计分析模块406,用于基于第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对近似案件的裁决结果进行统计分析,得到第一分析结果,将第一分析结果返回至终端。在一个实施例中,案件特征提取模块402还用于根据预设的多个目标因子,识别案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;否则,调用预设模型识别案件信息中的因子描述语句,计算因子描述语句与预设的多个模板描述语句的相似度,获取相似度超过阈值的模板描述语句关联的参考因子值,根据参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。在一个实施例中,序列模型包括编码器、解码器和注意力模块;案件统计表包括多个字段枚举值;检索分析语句生成模块404还用于调用编码器对特征向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用解码器对压缩向量对解码处理,得到每个字段枚举值对应的初始匹配概率;调用注意力模块对压缩向量进行注意力训练,得到每个字段枚举值对应的相似度加权;根据相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。在一个实施例中,裁决统计分析模块406还用于获取第一图表模板,根据第一图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在第一分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及分别对应的坐标元素和坐标值构建第一分析图表;根据第一分析结果生成当前案件的建议裁决结果,并计算建议裁决结果的置信度;将第一分析图表、建议裁决结果及对应的置信度发送至终端。在一个实施例中,该装置还包括分析意图识别模块408,用于接收终端发送的第二裁决分析请求;第二裁决分析请求携带了检索分析语句;获取案件统计表的表信息;根据检索分析语句及表信息,生成目标向量;将目标向量输入预设的序列模型,得到分析意图表达式;检索分析语句生成模块404还用于将目标向量输入预设的意图分类模型,得到第二SQL模板;将分析意图表达式填充至第二SQL模板,得到第二检索分析语句;裁决统计分析模块406还用于基于第二检索分析语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,将得到的第二分析结果返回至终端。在一个实施例中,表信息包括多个字段枚举值;分析意图识别模块408还用于对检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个字段枚举值对应的词向量,记作第二向量;计算第一向量与不同第二向量的相似度;将第一向量与相似度最高的第二向量进行拼接,得到目标向量。关于裁决结果分析装置的具体限定可以参见上文中对于裁决结果分析方法的限定,在此不再赘述。上述裁决结果分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储案件统计表、SQL模板等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种裁决结果分析方法。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的裁决结果分析方法的步骤。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和或易失性存储器。非易失性存储器可包括只读存储器ROM、可编程ROMPROM、电可编程ROMEPROM、电可擦除可编程ROMEEPROM或闪存。易失性存储器可包括随机存取存储器RAM或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAMSRAM、动态RAMDRAM、同步DRAMSDRAM、双数据率SDRAMDDRSDRAM、增强型SDRAMESDRAM、同步链路SynchlinkDRAMSLDRAM、存储器总线Rambus直接RAMRDRAM、直接存储器总线动态RAMDRDRAM、以及存储器总线动态RAMRDRAM等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

权利要求:1.一种裁决结果分析方法,所述方法包括:接收终端发送的第一裁决分析请求;所述第一裁决分析请求包含案件标识;根据所述案件标识,获取当前案件对应的案件信息;基于所述案件信息生成当前案件的特征向量;将所述特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将所述分析维度表达式及所述分析条件表达式填充至所述第一SQL模板,得到第一检索分析语句;基于所述第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对所述近似案件的裁决结果进行统计分析,得到第一分析结果,将所述第一分析结果返回至所述终端。2.根据权利要求1所述的方法,其特征在于,所述基于所述案件信息生成当前案件的特征向量,包括:根据预设的多个目标因子,识别所述案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;若否,调用预设模型识别所述案件信息中的因子描述语句,计算所述因子描述语句与预设的多个模板描述语句的相似度,获取所述相似度超过阈值的模板描述语句关联的参考因子值,根据所述参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。3.根据权利要求1所述的方法,其特征在于,所述序列模型包括编码器、解码器和注意力模块;所述案件统计表包括多个字段枚举值;所述将所述特征向量输入预设的序列模型,得到分析维度表达式,包括:调用所述编码器对所述特征向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用所述解码器对所述压缩向量对解码处理,得到每个所述字段枚举值对应的初始匹配概率;调用所述注意力模块对所述压缩向量进行注意力训练,得到每个所述字段枚举值对应的相似度加权;根据所述相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个所述字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。4.根据权利要求1所述的方法,其特征在于,所述将所述第一分析结果返回至所述终端,包括:获取第一图表模板,根据所述第一图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在所述第一分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及分别对应的坐标元素和坐标值构建第一分析图表;根据所述第一分析结果生成当前案件的建议裁决结果,并计算所述建议裁决结果的置信度;将所述第一分析图表、建议裁决结果及对应的置信度发送至所述终端。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收终端发送的第二裁决分析请求;所述第二裁决分析请求携带了检索分析语句;获取所述案件统计表的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到第二SQL模板;将所述分析意图表达式填充至所述第二SQL模板,得到第二检索分析语句;基于所述第二检索分析语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将得到的第二分析结果返回至所述终端。6.根据权利要求5所述的方法,其特征在于,所述表信息包括多个字段枚举值;所述根据所述检索分析语句及所述表信息,生成目标向量,包括:对所述检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个所述字段枚举值对应的词向量,记作第二向量;计算所述第一向量与不同第二向量的相似度;将所述第一向量与相似度最高的第二向量进行拼接,得到所述目标向量。7.一种裁决结果分析装置,所述装置包括:案件特征提取模块,用于接收终端发送的第一裁决分析请求;所述第一裁决分析请求包含案件标识;根据所述案件标识,获取当前案件对应的案件信息;基于所述案件信息生成当前案件的特征向量;检索分析语句生成模块,用于将所述特征向量输入预设的序列模型,得到分析维度表达式;获取分析条件表达式及第一SQL模板,将所述分析维度表达式及所述分析条件表达式填充至所述第一SQL模板,得到第一检索分析语句;裁决统计分析模块,用于基于所述第一检索分析语句在预设的案件统计表中查询当前案件的近似案件,并对所述近似案件的裁决结果进行统计分析,得到第一分析结果,将所述第一分析结果返回至所述终端。8.根据权利要求7所述的装置,其特征在于,所述案件特征提取模块还用于根据预设的多个目标因子,识别所述案件信息中是否记载了对应的因子值;若是,提取相应目标因子的因子值;否则,调用预设模型识别所述案件信息中的因子描述语句,计算所述因子描述语句与预设的多个模板描述语句的相似度,获取所述相似度超过阈值的模板描述语句关联的参考因子值,根据所述参考因子值确定当前案件相应目标因子的因子值;基于多个目标因子分别对应的因子值计算当前案件的特征向量。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

百度查询: 平安科技(深圳)有限公司 裁决结果分析方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。