买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】因果去偏差模型指导的法院观点自动生成方法_浙江大学_202011238302.4 

申请/专利权人:浙江大学

申请日:2020-11-09

公开(公告)日:2023-08-04

公开(公告)号:CN112307726B

主分类号:G06F40/166

分类号:G06F40/166;G06F18/214;G06F18/213;G06F18/2415;G06N3/0464;G06N3/049;G06N3/08;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2023.08.04#授权;2021.02.23#实质审查的生效;2021.02.02#公开

摘要:本发明公开了一种因果去偏差模型指导的法院观点自动生成方法,属于自然语言生成领域。包括如下步骤:1根据关键字,将裁判文书按照原告诉请、事实描述以及法院观点进行分割,并对法院观点中的判决结果进行支持与否的标注,以得到训练数据集;2通过一个诉请感知编码器,先对原告诉请和事实描述分别进行信息抽取,再对事实描述进行一次基于原告诉请的注意力计算,以得到感知了诉请的事实的向量化特征表示;3利用一对反事实解码器来生成不同判决下的法院观点;4通过连接一个判决预测器来选择最终的“法院观点”。相比一般的文本生成算法,本发明充分考虑了真实场景中判决结果分布不均匀这一客观事实,并有效地消除了潜在的偏向性。

主权项:1.一种因果去偏差模型指导的法院观点自动生成方法,其特征在于,包括如下步骤:S1:根据关键字,将裁判文书按照原告诉请、事实描述以及法院观点进行分割,并对法院观点中的判决结果进行支持与否的标注,以得到训练数据集,其具体实现步骤为:S101:利用关键字,从裁判文书中分别提取出原告诉请、事实描述以及法院观点;其中,原告诉请是一段阐明原告的诉请的描述性语句,其表示为其中表示原告诉请中的第t个词,m表示原告诉请中总的词数;事实描述是一段包含法院认定查明的事实的描述性语句,其表示为其中表示事实描述中的第t个词,n表示事实描述中总的词数;法院观点包括理由和判决两个部分,理由是与诉请相关的事实总结,是判决的依据,而判决是对原告诉请的支持与否,其表示为其中表示法院观点中的第t个词,l表示法院观点中总的词数;S102:获取每个法院观点v对应的判决u,其中u=1表示支持,u=0表示不支持;S103:将每个用来训练与测试的样本表示为四元组c,f,v,u,并构建成训练数据集;S2:利用一个诉请感知编码器,对原告诉请和事实描述分别进行信息抽取,并对事实描述进行一次基于原告诉请的注意力计算,以得到感知了诉请的事实描述向量化特征表示,其具体实现步骤为:S201:对于输入编码器的原告诉请词序列c和事实描述词序列f,首先将每个词映射成由300维向量表示的词嵌入,然后将这两个词嵌入序列各自通过一个双向LSTM,得到两个分别对应原告诉请与事实描述的隐藏状态序列hc和hf;S202:利用诉请感知的注意力机制来合并hc和hf,其中对于每个隐藏状态hfi,诉请注意力分布qi通过如下公式计算得到: qi=softmaxei其中表示原告诉请中的第j个词对于事实描述中第i个词的初始权重;ei为事实描述中第i个词的初始权重分布;v,Wh,Ws,battn均为需要学习的参数;基于诉请注意力分布计算新的事实描述为: 其中表示原告诉请中的第j个词相对于事实描述中第i个词的最终权重;hcj表示hc的第j个元素;S203:将新的事实描述通过另一个双向LSTM层后,得到输入的最终表达h,作为感知了诉请的事实描述向量化特征表示;S3:基于感知了诉请的事实描述向量化特征表示,利用一对反事实解码器来生成不同判决下的法院观点,得到支持性判决下的法院观点和不支持性判决下的法院观点,其具体实现步骤为:S301:构建一对由两个解码器组成的反事实解码器,两个解码器的结构相同,分别用于生成支持性判决下的法院观点和不支持性判决下的法院观点;S302:每个解码器中,首先计算词的概率分布;其中在解码的当前第t步,给定编码器输出的最终表达h和解码器的当前状态st,通过注意力机制计算得到注意力分布at,再根据h和at的加权和获得上下文向量 其中表示注意力分布at中的第i个元素;将作为输入对于当前步的表达,其与st连接后,再通过一个线性层,得到词的初始概率分布pvocab: 其中V,V′,b,b′都是需要学习的参数;S303:每个解码器中,利用生成概率方法解决未登录词问题;其中给定上下文向量和解码器状态st,以及解码器的输入xt,所述生成概率Pgen通过如下公式得到: 其中,ws,wx以及bptr都是需要学习的参数,上标T表示转置,σ是Sigmoid函数;最终解码器生成法院观点时一个词w的生成概率为: 其中pvocabw表示初始概率分布pvocab中词w的概率;Φ表示词w在事实描述中出现的位置的集合;S4:基于感知了诉请的事实描述向量化特征表示,通过预测器预测其判决结果,并根据判决结果选择S3中得到的该判决结果下对应的法院观点,作为最终生成的本院观点。

全文数据:

权利要求:

百度查询: 浙江大学 因果去偏差模型指导的法院观点自动生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。