买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于知识图谱和文本分类模型的法律条文推荐方法_南京烽火星空通信发展有限公司_202110548315.X 

申请/专利权人:南京烽火星空通信发展有限公司

申请日:2021-05-19

公开(公告)日:2024-01-09

公开(公告)号:CN113065005B

主分类号:G06F16/36

分类号:G06F16/36;G06F16/35;G06F40/284;G06N3/0464;G06N3/08;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2024.01.09#授权;2021.07.20#实质审查的生效;2021.07.02#公开

摘要:本发明公开了一种基于知识图谱和文本分类模型的法律条文推荐方法,步骤包括:法律知识图谱构建、训练文本数据预处理、多标签分类模型训练、法律罪名要素识别、法律条文推荐。本发明采用知识图谱存储法律知识,可以详细展示各级罪名的关联,同时能够快速响应查询结果,能够方便的进行知识扩展和更新。采用TextCNN进行多标签文本分类,使用罪名作为分类标签,解决了罪名与法条不是一对一对应关系的问题。针对法律罪名信息的组合多样性,可以不断补充语料进行迭代,扩充法条推荐的广度。

主权项:1.一种基于知识图谱和文本分类模型的法律条文推荐方法,其特征在于,所述方法包括如下步骤:步骤一、法律知识图谱构建;步骤二、训练文本数据预处理;步骤三、多分类标签模型训练;所述多分类标签模型训练,包括:301、采用TextCNN算法进行多标签模型训练,其中,句子向量可以表示为Xi:n,n为句子分词的长度,每个词向量用xi表示: 每一次滑窗的卷积操作结果为ci:ci=fω·Xi:i+h-1b;其中,ω表示的是卷积核,维度是h*k;Xi:i+h-1表示的是Xi:n中每次的滑窗矩阵,维度是h*k,同时,f是激活函数;由于句子长度为n,卷积核高度为h,需要滑窗n-h+1次,卷积汇总结果表示为:c=[c1,c2,…,cn-h+1];采用全局最大池化进行卷积,即卷积核个数num_filters有多个,设卷积核数量为m,则最终池化结果为: 将池化层结果经过全连接层转换,通过sigmoid函数压缩成数值在0,1的实数,表示各分类的概率,得到T×1的向量y,T表示标签类别,W表示权重矩阵,b为偏置项:y=sigmoidW*z+b;302、将文本数据划分为train、evaluate、test三个数据集,通过train数据进行训练,其他数据集进行评估和测试;303、设置学习率为0.0001,loss值计算加入L1正则化,将训练数据通过embedding_matrix转成向量,进行轮询训练;304、将训练好的最优模型进行保存,用于法律罪名要素识别;步骤四、法律罪名要素识别;步骤五、法律条文推荐,根据罪名分类在法律知识图谱中快速找到对应的法律罪名实体和对应的法律条文实体。

全文数据:

权利要求:

百度查询: 南京烽火星空通信发展有限公司 一种基于知识图谱和文本分类模型的法律条文推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。