买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】裁决信息检索分析方法、装置、计算机设备和存储介质_平安科技(深圳)有限公司_201910520201.7 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-06-17

公开(公告)日:2023-12-19

公开(公告)号:CN110362798B

主分类号:G06F40/186

分类号:G06F40/186;G06F16/33;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2023.12.19#授权;2021.07.06#实质审查的生效;2019.10.22#公开

摘要:本申请涉及一种基于机器学习的裁决信息检索分析方法、装置、计算机设备和存储介质。所述方法包括:接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将分析结果返回至所述终端。采用本方法能够提高裁决信息检索分析效率。

主权项:1.一种裁决信息检索分析方法,所述方法包括:接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;确定所述案件统计表的步骤包括:获取多个历史案件的案件文件;通过正则匹配,在所述案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将所述因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个所述案件标识及每个案件标识对应的案件因子构建案件统计表;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析;获取所述目标SQL模板关联的图表模板;根据所述图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及每个所述基础坐标对应的坐标元素和坐标值构建目标图表,并根据所述目标图表生成裁决结果分析页面;根据所述基础坐标及坐标元素,确定对应的备选图表类型;在所述裁决结果分析页面添加每个备选图表类型对应的备选选项,将添加了备选选项的裁决结果分析页面返回至所述终端。

全文数据:裁决信息检索分析方法、装置、计算机设备和存储介质技术领域本申请涉及计算机技术领域,特别是涉及一种裁决信息检索分析方法、装置、计算机设备和存储介质。背景技术目前,在案件审理过程中,法官和律师为了更加准确高效的对当前案件进行裁决处理,会期望检索了解以往相关案件的案件处理情况,如法院的裁决意见倾向。然而,传统方式仅支持用户基于国家法律体系中规定的案由和罪名进行文书索引,并笼统的将每个相关案件的裁决文书反馈给用户。这种方式需要用户人工逐个翻查裁决文书,难以快速了解相关案件的案件处理情况,使得裁决信息检索分析效率降低。发明内容基于此,有必要针对上述技术问题,提供一种能够自动统计法院对以往相关案件的案件处理情况,进而提高裁决信息检索分析效率的裁决信息检索分析方法、装置、计算机设备和存储介质。一种裁决信息检索分析方法,所述方法包括:接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将分析结果返回至所述终端。在一个实施例中,所述获取案件统计表及对应的表信息之前,还包括:获取多个历史案件的案件文件;通过正则匹配,在所述案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将所述因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个所述案件标识及每个案件标识对应的案件因子构建案件统计表。在一个实施例中,所述表信息包括多个字段枚举值;所述根据所述检索分析语句及所述表信息,生成目标向量,包括:对所述检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个所述字段枚举值对应的词向量,记作第二向量;计算所述第一向量与不同第二向量的相似度;将所述第一向量与相似度最高的第二向量进行拼接,得到所述目标向量。在一个实施例中,所述序列模型包括维度序列模型和条件序列模型;所述分析意图表达式包括分析维度表达式;所述将所述目标向量输入预设的序列模型,得到分析意图表达式,包括:调用所述维度序列模型对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式;调用所述条件序列模型对所述目标向量中包含分析维度信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式。在一个实施例中,所述维度序列模型包括编码器、解码器和注意力模块;所述调用所述维度序列模型对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式,包括:调用所述编码器对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用所述解码器对所述压缩向量对解码处理,得到每个所述字段枚举值对应的初始匹配概率;调用所述注意力模块对所述压缩向量进行注意力训练,得到每个所述字段枚举值对应的相似度加权;根据所述相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个所述字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。在一个实施例中,所述将分析结果返回至所述终端,包括:获取所述目标SQL模板关联的图表模板;根据所述图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及每个所述基础坐标对应的坐标元素和坐标值构建目标图表,并根据所述目标图表生成裁决结果分析页面;根据所述基础坐标及坐标元素,确定对应的备选图表类型;在所述裁决结果分析页面添加每个备选图表类型对应的备选选项,将添加了备选选项的裁决结果分析页面返回至所述终端。一种裁决信息检索分析装置,所述装置包括:分析意图识别模块,用于接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;检索分析语句生成模块,用于将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;查询统计分析模块,用于基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将分析结果返回至所述终端。在一个实施例中,该装置还包括案件统计表构建模块,用于获取多个历史案件的案件文件;通过正则匹配,在所述案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将所述因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个所述案件标识及每个案件标识对应的案件因子构建案件统计表。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的裁决信息检索分析方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的裁决信息检索分析方法的步骤。上述裁决信息检索分析方法、装置、计算机设备和存储介质,基于序列模型和意图分类模型,可以准确识别用户基于检索分析语句表达的检索分析意图;结合预先解构的案件统计表,可以提高裁决信息检索分析效率,进而可以快速响应用户不同的检索分析意图。附图说明图1为一个实施例中裁决信息检索分析方法的应用场景图;图2为一个实施例中裁决信息检索分析方法的流程示意图;图3为一个实施例中分析意图表达式确定的步骤的流程示意图;图4为一个实施例中裁决信息检索分析装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的裁决信息检索分析方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当用户需要进行基于当前案件进行检索分析时,可以通过终端102向服务器104发送裁决分析请求。裁决分析请求携带了检索分析语句。服务器104存储了预先构建的案件统计表。案件统计表记录了多个历史案件的字段枚举值,如案由、地域等案件因子。服务器104获取案件统计表的表信息,并根据表信息和检索分析语句,生成用于表征用户检索意图的目标向量。服务器104基于历史案件的案件信息预先训练了序列模型和意图分类模型。服务器将目标向量输入序列模型,输出得到多个分析意图表达式,并将目标向量输入意图分类模型,输出得到目标SQL模板。服务器104根据分析意图表达式在对应检索分析语句中出现的顺序,将多个分析意图表达式依次填充至目标SQL模板,得到SQL查询语句。服务器104基于SQL查询语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,将分析结果返回至终端102,使用户根据分析结果了解以往相关案件的裁决意见倾向后,作出对当前案件的裁决决定。上述裁决信息检索分析过程,基于序列模型和意图分类模型,可以准确识别用户基于检索分析语句表达的检索分析意图;结合预先解构的案件统计表,可以提高裁决信息检索分析效率。在一个实施例中,如图2所示,提供了一种裁决信息检索分析方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤202,接收终端发送的裁决分析请求;裁决分析请求携带了检索分析语句。检索分析语句可以是自然语言形成的一个或多个短句。例如,“金融借款类案件在广东地区的支持率”、“2018年广东地区合同解除纠纷类案件的比重”、“涉及借贷纠纷的案子一般都分布在哪儿”等。检索分析语句可能是存在语法错误,语义不连贯的语句。例如,“近五年贷款逾期还款的判案趋势,比如广东法院”等。对于存在语法错误,语义不连贯的检索分析语句,服务器对检索分析语句进行语义分析,生成对应的一种或多种语义连贯的检索意图语句,并基于检索意图语句生成检索意图确认提示,将检索意图确认提示返回至终端。用户可以基于检索意图确认提示选定一个检索意图语句,终端将选定信息发送至服务器。服务器按照本实施例提供的方法基于用户选定检索意图语句进行检索分析。在另一个实施例中,检索分析语句也可以是多个检索字段,对此不做限制。步骤204,获取案件统计表及对应的表信息。案件统计表记录了多个历史案件的案件信息。案件信息可以包括从案件文件中解构得到的案件标识和多个案件因子。案件文件可以是历史案件的诉讼请求书、裁决文书等。案件因子可以是历史案件的裁决结果、年利率、主体、地域、裁判时间、法院层级或案由等。案件统计表可以如下表1所示。表1服务器获取案件统计表的表信息。表信息包括表名、多个表头以及每个表头对应的多个字段枚举值。每个表头可以是一种案件因子。例如,表1中,第一行的每个字段即为一个表头,每一列其余行的多个字段即为相应表头对应的多个字段枚举值,如“广东深圳”、“上海”分别为表头“地域”的字段枚举值。步骤206,根据检索分析语句及表信息,生成目标向量。服务器分别计算检索分析语句和表信息对应的表征向量,将检索分析语句对应的表征向量与表信息对应的表征向量进行拼接,得到目标向量。步骤208,将目标向量输入预设的序列模型,得到分析意图表达式。服务器基于大量真实的历史案件的案件信息预先训练了序列模型。序列模型用于识别用户的检索分析意图,即挖掘检索分析语句中能够反应用户期望的分析维度和分析条件等的潜在信息。分析意图表达式可以是Key-value键值对的形式,如检索分析语句“金融借款类案件在广东地区的支持率”对应的分析意图表达式可以是“案由=金融借款纠纷”、“地域=广东*”、“裁判结果=支持”、“意图=支持比例”。再比如,检索分析语句“涉及借贷纠纷的案子一般都分布在哪儿”对应的分析意图表达式分别可以是“案由=*借贷纠纷OR*借款纠纷”、“意图=地域”。步骤210,将目标向量输入预设的意图分类模型,得到目标SQL模板。服务器预置了多种SQL模板。不同的SQL模板用于满足用户基于不同维度和条件的检索分析意图。服务器训练训练了意图分类模型。意图分类模型用于根据当前用户检索分析意图确定选用哪种SQL模板。意图分类模型可以是基于大量模拟的检索分析语句以及每个检索分析语句对应标注的目标SQL模板,对基础分类模型进行有监督训练得到的。基础训练模型可以是RNN模型Recurrentneuralnetwork,循环神经网络模型。服务器将检索分析语句对应的多个目标向量依次输入意图分类模型,得到目标SQL模板。步骤212,将分析意图表达式填充至目标SQL模板,得到SQL查询语句。不同的SQL模板的填充方式可以不同。服务器按照目标SQL模板的填充方式将分析意图表达式填充至目标SQL模板,即可得到SQL查询语句。在另一个实施例中,序列模型还输出每个分析意图表达式对应的意图强度,根据意图强度对多个分析意图表达式进行排序,根据排序将多个分析意图表达式填充至目标SQL模板,得到SQL查询语句。在又一个实施例中,每个分析意图表达式在检索分析语句具有对应的意图表达分词,例如,检索分析语句“涉及借贷纠纷的案子一般都分布在哪儿”中,分析意图表达式“案由=*借贷纠纷OR*借款纠纷”对应的意图表达分词可以是“借贷纠纷”,“意图=地域”对应的意图表达分词可以是“在哪儿”。服务器根据意图表达式对应意图表达分词在检索分析语句中出现的顺序,依次将多个分析意图表达式填充至目标SQL模板。步骤214,基于SQL查询语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,将分析结果返回至终端。基于不同SQL查询语句不仅可以实现裁判时间、地域、案由等不同维度的数据查询;还可以实现案件比重、案件数量、支持率等不同条件的数据统计。服务器基于SQL查询语句在案件统计表中进行数据查询和统计分析,将分析结果返回至终端。对于以往相关案件的案件处理信息查询,传统方式直接通过预置词表的方式粗狂的断定用户检索意图,且不支持用户以自然语言的方式进行检索。此外,预置词表不仅需要花费大量的人力,且难以保证词表信息的覆盖率,一旦用户输入的某个检索关键词在词表中没有覆盖到,则检索分析失败。而本申请支持用户以自然语言的方式进行检索。容易理解,自然语言相比单独的检索关键词可以更加准确的表达用户的检索意图,从而基于检索分析语句可以更加准确的挖掘用户的检索分析意图。本申请还通过机器学习预先训练序列模型和意图分类模型,可以进一步快速准确识别用户的检索分析意图,相比预置词表可以减少人工参与,实现真正意义上端到端的裁决信息检索分析。本实施例中,根据终端发送的裁决分析请求,可以获取得到检索分析语句;根据检索分析语句以及预置的案件统计表的表信息,可以生成目标向量;将目标向量输入预设的序列模型,可以得到多个分析意图表达式;将目标向量输入预设的意图分类模型,可以得到目标SQL模板;将分析意图表达式填充至目标SQL模板,可以得到SQL查询语句;基于SQL查询语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,可以得到分析结果,将分析结果返回至终端,可以满足用户不同的检索分析意图。基于序列模型和意图分类模型,可以准确识别用户基于检索分析语句表达的检索分析意图;结合预先解构的案件统计表,可以提高裁决信息检索分析效率,进而可以快速响应用户不同的检索分析意图。在一个实施例中,获取案件统计表及对应的表信息之前,还包括:获取多个历史案件的案件文件;通过正则匹配,在案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个案件标识及每个案件标识对应的案件因子构建案件统计表。不同案件因子的提取方式可以不同。对于在案件文件中直接明文记载的信息内容,可以利用关键词匹配或者正则匹配即可得到对应案件因子的因子值,如裁判时间。而对于在案件文件中没有明文记载在案件因子的因子值,则需要基于预先训练的语义理解模型进行提炼。语义理解模型可以是基于大量样本案件的案件文件训练得到的,用于提取目标案件因子的因子值,记作目标因子值。具体的,服务器通过正则匹配在历史案件的案件文件中筛选与目标案件因子相关的描述语句,记作因子描述语句。服务器对筛选得到的因子描述语句进行目标因子值标注。不同的因子描述语句及对应的目标因子值分别构成不同的样本。基于大量的样本对待训练初始模型进行训练,得到语义理解模型。待训练初始模型可以是X-GBoost模型等。为了保证检索分析的准确性,案件统计表可以是动态更新的。例如,按照预设时间频率在指定网站爬取新增案件的案件文件,并按照上述方式对案件文件进行解构,将解构得到的案件信息记录至案件统计表。本实施例中,预先对大量历史案件的案件文件解构,并利用解构的案件信息构建案件统计表,基于案件统计表可以快速响应用户不同的检索分析意图,方面用户快速从不同角度了解以往相关案件的案件处理情况,继而提高裁决信息检索分析效率。在一个实施例中,表信息包括多个字段枚举值;序列模型包括维度序列模型和条件序列模型;维度序列模型包括编码器、解码器和注意力模块;分析意图表达式包括分析维度表达式和分析条件表达式。如图3所示,根据检索分析语句及表信息,生成目标向量,将目标向量输入预设的序列模型,得到分析意图表达式,即分析意图表达式确定的步骤,包括:步骤302,对检索分析语句进行分词,计算每个分词的词向量,记作第一向量。服务器对检索分析语句进行分词,并对得到的多个分词进行去停用词和同义词替换等优化处理。例如,上述举例中检索分析语句“2018年广东地区合同解除纠纷类案件的比重”对应的分词可以有“2018年”、“广东”、“地区”、“合同解除类”、“案件”、“的”和“比重”。其中,分词“地区”“案件”“的”作为停用词可以去除;分词“比重”可以利用同义词“比例”替换。服务器对优化处理后的每个分词进行One-hot独热编码,得到每个分词对应的第一向量。容易理解,一个检索分析语句可能会对应有多个第一向量。第一向量可以是采用其他方式计算得到,对此不做限制。步骤304,计算每个字段枚举值对应的词向量,记作第二向量。服务器按照上述计算案件统计表中每个字段枚举值的第二向量。在另一个实施例中,第二向量可以服务器预先计算并记录在案件统计表中的,可以提高向量匹配效率,进而提高检索分析效率。步骤306,计算第一向量与不同第二向量的相似度;将第一向量与相似度最高的第二向量进行拼接,得到目标向量。服务器通过计算第一向量与第二向量的欧式距离等方式,得到第一向量与每个第二向量的相似度。服务器比较最高的相似度是否达到阈值。若是,服务器将第一向量与相似度最高的第二向量拼接,得到目标向量。将第一向量与相似度高的第二向量拼接,可以使用户的检索意图特征更加明显,提高模型识别精度。若与第一向量相似度最高的第二向量有多个,且相似度均达到阈值,则本实施例服务器随机将该第一向量与相似度最高的一个第二向量拼接。换言之,本实施例优化处理后的每个分词最后与一个字段枚举值相对应。例如,上述举例中分词“广东”在案件统计表中没有完全匹配的字段枚举值,与“广东深圳”、“广东广州”等字段枚举值的向量相似度相同,则服务器随机将相似度最高且相同的多个字段枚举值其中一个的第二向量与相应分词的第一向量拼接。容易立即,还可以采用其他向量拼接的方式,对此不作限制。步骤308,调用条件序列模型对目标向量中包含分析维度信息的局部向量进行遗忘处理,得到一个或多个分析条件表达式。序列模型用于识别用户的检索分析意图。序列模型包括维度序列模型和条件序列模型。维度序列模型与条件序列模型分别可以是不同的RNN模型,如LSTMLongShort-TermMemory,长短期记忆网络等。检索分析意图是指用户期望对案件统计表中哪些维度的案件信息进行哪方面的统计分析,包括分析维度意图和分析条件意图。其中,维度序列模型用于识别用户的分析维度意图;条件序列模型用于识别用户的分析条件意图。同一个检索分析语句可能对应多个目标向量。通过LSTM对各目标向量中包含分析维度信息进行遗忘处理,筛选得到分析条件字段值。服务器根据分析条件字段值生成分析条件表达式。例如,可以将预设的“意图”字段作为Key值,将分析条件字段值或者对分析条件字段值转换后作为Value值,构成的Key-Value键值对可以作为分析条件表达式。步骤3102,调用编码器对目标向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量。步骤3104,调用解码器对压缩向量对解码处理,得到每个字段枚举值对应的初始匹配概率。步骤3106,调用注意力模块对压缩向量进行注意力训练,得到每个字段枚举值对应的相似度加权。步骤3108,根据相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个字段枚举值对应的目标匹配概率。步骤3110,根据目标匹配概率最高的字段枚举值生成分析维度表达式。维度序列模型包括编码器、解码器和注意力模块。其中,编码器、解码器及注意力模块亦可以分别为不同的RNN模型。编码器用于对检索分析语句进行编码,即对对应多个目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个压缩向量。压缩向量蕴含了检索分析语句的语句含义。解码器用于对压缩向量进行降维处理,并基于降维后的压缩向量映射计算目标向量与每个字段枚举值的初始匹配概率。注意力模块用于对降维后的压缩向量进行注意力训练,计算目标向量与每个字段枚举值对应的相似度加权。解码器还用于根据相似度加权对目标向量与相应字段枚举值的初始匹配概率进行调整,得到每个目标向量与不同字段枚举值的目标匹配概率。服务器基于目标匹配概率最高的字段枚举值生成相应目标向量对应的分析维度表达式。例如,将目标匹配概率最高的字段枚举值所对应的表头作为Key值,将目标匹配概率最高的字段枚举值或对目标匹配概率最高的字段枚举值转换后作为Value值,构成的Key-Value键值对可以作为分析维度表达式。其中,对目标匹配概率最高的字段枚举值的转换处理可以是将字段枚举值中的部分字段以*等指定字符替换。例如,用户基于检索分析语句“2018年广东地区合同解除纠纷类案件的比重”的检索分析意图是仅对广东地区的案件进行统计,而案件统计表中并没有一个字段枚举值为“广东”,则可以将目标匹配概率最高的字段枚举值“广东深圳”转换为“广东*”。本实施例中,由于按照上述方式生成的分析意图表达式所包含的信息均为来自案件统计表,使得检索分析结果可以得到保证,可以避免因检索分析语句直接表述的检索关键词在案件统计表中不存在而导致统计结果失败,进而可以避免用户反复修改输入的检索分析信息,继而提高了检索分析效率。在一个实施例中,将分析结果返回至终端,包括:获取目标SQL模板关联的图表模板;根据图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及每个基础坐标对应的坐标元素和坐标值构建目标图表,并根据目标图表生成裁决结果分析页面;根据基础坐标及坐标元素,确定对应的备选图表类型;在裁决结果分析页面添加每个备选图表类型对应的备选选项,将添加了备选选项的裁决结果分析页面返回至终端。基于意图分类模型可以识别用户的检索分析意图,根据不同检索分析意图可以选用不同的图表模板。图表模板的图表类型可以是折线图、柱状图、雷达图等。每种图表模板关联了对应的坐标提取规则。根据坐标提取规则,可以在分析结果中提取得到多个基础坐标及每个基础坐标对应的坐标元素和坐标值。比如,检索分析语句“2018年广东地区合同解除纠纷类案件的比例”对应的目标图表类型可以是柱状图。其中,横坐标为合同解除结果,坐标元素为离散值“解除”和“不解除”两个;纵坐标为案件比例,坐标元素为连续值0~100%。预设每个目标图表对应的备选图表类型,可以支持对图表类型一键变更。在另一个实施例中,还支持用户对目标图表中图表元素进行变更。具体的,服务器接收终端发送的对目标图表的调整请求。调整请求携带了对目标图表中一个或多个图元的变更信息。服务器根据变更信息将目标图表中相应图元进行新增、删除或变更显示位置等处理。通过调整目标图表,方便用户在原始检索结果的基础上作进一步深度检索。本实施例中,以图表的方式可视化展示分析结果,使得分析结果更加直观;同时提供多个备选图表类型的选项,可以在保证分析结果反馈效率的同时,极大的满足用户的个性化需求。应该理解的是,虽然图2~图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2~图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图4所示,提供了一种裁决信息检索分析装置,包括:分析意图识别模块402、检索分析语句生成模块404和查询统计分析模块406,其中:分析意图识别模块402,用于接收终端发送的裁决分析请求;裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据检索分析语句及表信息,生成目标向量;将目标向量输入预设的序列模型,得到分析意图表达式。检索分析语句生成模块404,用于将目标向量输入预设的意图分类模型,得到目标SQL模板;将分析意图表达式填充至目标SQL模板,得到SQL查询语句。查询统计分析模块406,用于基于SQL查询语句在案件统计表中查询相关案件,并对相关案件的案件信息进行统计分析,将分析结果返回至终端。在一个实施例中,该装置还包括案件统计表构建模块408,用于获取多个历史案件的案件文件;通过正则匹配,在案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个案件标识及每个案件标识对应的案件因子构建案件统计表。在一个实施例中,表信息包括多个字段枚举值;分析意图识别模块402还用于对检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个字段枚举值对应的词向量,记作第二向量;计算第一向量与不同第二向量的相似度;将第一向量与相似度最高的第二向量进行拼接,得到目标向量。在一个实施例中,序列模型包括维度序列模型和条件序列模型;分析意图表达式包括分析维度表达式和分析条件表达式;分析意图识别模块402还用于调用维度序列模型对目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式;调用条件序列模型对目标向量中包含分析维度信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式。在一个实施例中,维度序列模型包括编码器、解码器和注意力模块;分析意图识别模块402还用于调用编码器对目标向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用解码器对压缩向量对解码处理,得到每个字段枚举值对应的初始匹配概率;调用注意力模块对压缩向量进行注意力训练,得到每个字段枚举值对应的相似度加权;根据相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。在一个实施例中,查询统计分析模块406还用于获取目标SQL模板关联的图表模板;根据图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及每个基础坐标对应的坐标元素和坐标值构建目标图表,并根据目标图表生成裁决结果分析页面;根据基础坐标及坐标元素,确定对应的备选图表类型;在裁决结果分析页面添加每个备选图表类型对应的备选选项,将添加了备选选项的裁决结果分析页面返回至终端。关于裁决信息检索分析装置的具体限定可以参见上文中对于裁决信息检索分析方法的限定,在此不再赘述。上述裁决信息检索分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储案件统计表、SQL模板等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种裁决信息检索分析方法。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的裁决信息检索分析方法的步骤。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和或易失性存储器。非易失性存储器可包括只读存储器ROM、可编程ROMPROM、电可编程ROMEPROM、电可擦除可编程ROMEEPROM或闪存。易失性存储器可包括随机存取存储器RAM或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAMSRAM、动态RAMDRAM、同步DRAMSDRAM、双数据率SDRAMDDRSDRAM、增强型SDRAMESDRAM、同步链路SynchlinkDRAMSLDRAM、存储器总线Rambus直接RAMRDRAM、直接存储器总线动态RAMDRDRAM、以及存储器总线动态RAMRDRAM等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

权利要求:1.一种裁决信息检索分析方法,所述方法包括:接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将分析结果返回至所述终端。2.根据权利要求1所述的方法,其特征在于,所述获取案件统计表及对应的表信息之前,还包括:获取多个历史案件的案件文件;通过正则匹配,在所述案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将所述因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个所述案件标识及每个案件标识对应的案件因子构建案件统计表。3.根据权利要求1所述的方法,其特征在于,所述表信息包括多个字段枚举值;所述根据所述检索分析语句及所述表信息,生成目标向量,包括:对所述检索分析语句进行分词,计算每个分词的词向量,记作第一向量;计算每个所述字段枚举值对应的词向量,记作第二向量;计算所述第一向量与不同第二向量的相似度;将所述第一向量与相似度最高的第二向量进行拼接,得到所述目标向量。4.根据权利要求3所述的方法,其特征在于,所述序列模型包括维度序列模型和条件序列模型;所述分析意图表达式包括分析维度表达式;所述将所述目标向量输入预设的序列模型,得到分析意图表达式,包括:调用所述维度序列模型对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式;调用所述条件序列模型对所述目标向量中包含分析维度信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式。5.根据权利要求4所述的方法,其特征在于,所述维度序列模型包括编码器、解码器和注意力模块;所述调用所述维度序列模型对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到一个或多个分析维度表达式,包括:调用所述编码器对所述目标向量中包含分析条件信息的局部向量进行遗忘处理,得到压缩向量;调用所述解码器对所述压缩向量对解码处理,得到每个所述字段枚举值对应的初始匹配概率;调用所述注意力模块对所述压缩向量进行注意力训练,得到每个所述字段枚举值对应的相似度加权;根据所述相似度加权对相应字段枚举值的初始匹配概率进行调整,得到每个所述字段枚举值对应的目标匹配概率;根据目标匹配概率最高的字段枚举值生成分析维度表达式。6.根据权利要求1所述的方法,其特征在于,所述将分析结果返回至所述终端,包括:获取所述目标SQL模板关联的图表模板;根据所述图表模板记录的坐标提取规则,确定多个基础坐标及坐标元素;在分析结果中提取每个坐标元素对应的坐标值;基于多个基础坐标及每个所述基础坐标对应的坐标元素和坐标值构建目标图表,并根据所述目标图表生成裁决结果分析页面;根据所述基础坐标及坐标元素,确定对应的备选图表类型;在所述裁决结果分析页面添加每个备选图表类型对应的备选选项,将添加了备选选项的裁决结果分析页面返回至所述终端。7.一种裁决信息检索分析装置,所述装置包括:分析意图识别模块,用于接收终端发送的裁决分析请求;所述裁决分析请求携带了检索分析语句;获取案件统计表及对应的表信息;根据所述检索分析语句及所述表信息,生成目标向量;将所述目标向量输入预设的序列模型,得到分析意图表达式;检索分析语句生成模块,用于将所述目标向量输入预设的意图分类模型,得到目标SQL模板;将所述分析意图表达式填充至所述目标SQL模板,得到SQL查询语句;查询统计分析模块,用于基于所述SQL查询语句在所述案件统计表中查询相关案件,并对所述相关案件的案件信息进行统计分析,将分析结果返回至所述终端。8.根据权利要求7所述的装置,其特征在于,还包括案件统计表构建模块,用于获取多个历史案件的案件文件;通过正则匹配,在所述案件文件中提取相应历史案件的案件标识以及一个或多个因子描述语句;将所述因子描述语句输入预设的语义理解模型,得到多个案件因子;基于多个所述案件标识及每个案件标识对应的案件因子构建案件统计表。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

百度查询: 平安科技(深圳)有限公司 裁决信息检索分析方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。