买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种用于法律判决文书的长文本生成式摘要方法_桂林电子科技大学_202410081176.8 

申请/专利权人:桂林电子科技大学

申请日:2024-01-19

公开(公告)日:2024-04-16

公开(公告)号:CN117891936A

主分类号:G06F16/34

分类号:G06F16/34;G06F40/151;G06F40/126;G06F40/117;G06F40/289;G06F40/216;G06Q50/18;G06N3/0455;G06N3/0464

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.03#实质审查的生效;2024.04.16#公开

摘要:本发明公开了一种用于法律判决文书的长文本生成式摘要方法,首先,对原始法律判决文书数据集进行语料转换;其次,将转换过的文本输入到RoBERTa模型中进行处理,使用编码器对文本进行法律文本摘要特征提取;最后,利用UniLM的seq2seqLM,生成法律判决文书的精炼摘要。为了克服模型解码时无法生成表中未包含字词的问题,引入了复制机制。同时为解决生成判决文本摘要中的重复性,采用了覆盖机制。这一创新方法为法律领域的文书摘要生成提供了高效、准确的解决方案。本发明方法能够自动生成法律判决文书摘要,具备简便易用的特点,减少了对人工干预的需求,其高度应用性使其在判决文书处理、文案处理等领域展现出广泛的适用性。

主权项:1.一种用于法律判决文书的长文本生成式摘要方法,其特征在于,包括以下步骤:步骤1:对原始法律判决文书数据集进行语料转换;步骤1.1:替换法律判决文书中专有名词名称标签;步骤1.2:使用语料转换算法对法律判决文书数据集进行语料转换;步骤2:将经步骤1转换过的文本输入到RoBERTa模型中进行处理,使用编码器对文本进行法律文本摘要特征提取;步骤2.1对输入到RoBERTa模型中的文本进行编码;步骤2.2:采用RoBERTa模型的双向Transformer编码器获取文本的特征表示;步骤3:采用UniLM模型中Seq2Seq-AttentionLM框架结构生成法律文本摘要;步骤3.1:利用解码器进行解码预测;步骤3.2:在解码时加入覆盖机制和复制机制生成更完整的摘要。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种用于法律判决文书的长文本生成式摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。