【发明授权】一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法_大连理工大学_202010654090.1

申请/专利权人：大连理工大学

申请日：2020-07-09

公开（公告）日：2022-09-20

公开（公告）号：CN111859936B

主分类号：G06F40/279

分类号：G06F40/279;G06F16/35;G06N3/04;G06N3/08;G06Q50/18

优先权：

专利状态码：有效-授权

法律状态：2022.09.20#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要：一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法，属于深度学习技术领域，步骤为：1文本数据向量化处理得到文本对应的向量矩阵；2通过TextCNN模块提取文本数据的空间结构特征；3通过TextRNN模块提取文本数据的序列信息特征；4利用张量将文本数据的空间结构特征和序列信息特征构造为表征能力更强的高阶数据块；5在soft‑max层以高阶数据块作为输入进行分类，得到案件的专业管辖权结果。本发明针对跨域立案中的文本起诉材料设深度混合计算网络，有效融合TextCNN和TextRNN，联合学习文本数据的空间结构特征和序列信息特征，并为此采用张量外积的方式将两种特征提取结果构造成具有丰富语义的高阶数据块，完成分类任务，识别出案件的专业管辖权结果。

主权项：1.一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法，其特征在于，包括以下步骤：步骤1、文本的向量化表示；采用结巴分词模块对文本数据进行分词处理，采用百度停用词列表删除在文本中没有实际意义的停用词，再统计文本中单词出现的频率，选出Top5000的高频词汇作为词汇表；利用Word2Vec完成预训练，将单词转化为词嵌入向量，利用预训练得到的词向量替换文本数据中的单词，并将文本数据填充为统一的长度，将可变长度的文本数据转换为固定大小的l*k维矩阵的输入文本，其中l表示文档中单词的数量，k表示预训练单词转化为向量后的维度；步骤2、TextCNN模块提取文本数据的空间结构特征；对于输入文本经过向量化处理之后得到的嵌入层E1，将数据表示为X∈Rl×k，其中l表示文档中单词的数量，k表示预训练单词转化为向量后的维度；卷积核的大小为w∈Rd×k，其中d代表该卷积核提取到的单词个数；每次操作都是对嵌入层E1中的d个单词进行卷积运算，通过公式1得到对应的特征提取结果qj；qj＝fw·xj:j+d+b1其中，b代表偏置项，j代表卷积运算在数据X中的起始位置，f代表ReLU激活函数；共选择使用n个卷积核完成特征提取的任务，得到的特征提取结果如公式2所示；Q＝[q1,q2,...,qn]2其中，qi对应着第i个卷积核捕获的特征提取结果；将n个卷积核设置为相同大小，学习互补性的特征；在每次卷积运算之后，使用最大池化运算获得特征提取结果中的最大值，获得其中的显著特征，降低该模块的复杂度；步骤3、TextRNN模块提取文本数据的序列信息特征；在每个时刻t，LSTM通过吸收前一时刻的隐藏状态ht-1和单元状态ct-1以及当前时刻的输入xt，生成当前时刻的隐藏状态ht和单元状态ct；ct的计算过程如下：ft＝σWf·[ht-1,xt]+bf3it＝σWi·[ht-1,xt]+bi4 ht的计算过程如下：ot＝σWo·[ht-1,xt]+bo7 其中，σ代表Sigmoid函数，·代表矩阵乘法，代表逐元素乘法；ft、it和ot分别代表遗忘门、输入门和输出门的输出结果；Wf、Wi和Wo分别代表遗忘门、输入门和输出门的权重；bf、bi和bo分别代表遗忘门、输入门和输出门的偏差；Wc和bc分别代表更新单元状态的权重和偏差；代表当前时刻单元状态的更新值；输出门最后时刻的隐藏状态ht_last用作该模块的输出，作为文本数据的序列信息特征捕获结果；步骤4、基于张量的特征融合；张量是矢量在高维空间中的扩展，N阶张量表示为其中N是张量的阶数，In是张量在第n阶的维数；对于一个N阶张量和一个M阶张量它们的外积产生一个M+N阶张量其中的元素定义为：其中，a和b分别是张量A和B中的元素；采用张量外积的方式，将TextCNN模块和TextRNN模块分别提取到的文本数据的空间结构特征Q和序列信息特征ht_last构造成高阶的数据块Xs作为文本数据的特征融合结果，并将其作为下一阶段soft-max分类函数的输入；步骤5、soft-max分类，得到案件的专业管辖权结果；将文本数据的特征融合结果Xs作为soft-max分类器层的输入，并输出一个r维的类别向量y，其中r和专业管辖权类别的数量相等，且y中每一个元素的数值范围为0-1；soft-max使用归一化指数函数估计类概率，计算过程如下式：其中，u代表专业管辖权所属的类别；K代表专业管辖权所属的类别集合；Wp和bp分别代表soft-max分类器层的权重和偏差；选择概率最大的类别标签作为该案件专业管辖权的识别结果。

全文数据：

权利要求：

百度查询：大连理工大学一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

下一篇：一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

相关技术

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种适用于热辅助治疗的硝酸2-(4-甲基噻唑-5-基)乙酯盐脑靶向脂质体_山东京卫制药有限公司_202311121383.3

泌尿道菌群检测在女性泌尿道结石诊断中的应用_广东省科学院微生物研究所(广东省微生物分析检测中心)_202111500822.2

一种用于开槽埋管的冷冻施工辅助设备及方法_长江生态环保集团有限公司_202310118173.2

光催化装置嵌入沉砂池协同降解辣椒素污水与除砂_山东建筑大学_202111505610.3

一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

一种焊枪铜线的自动夹扣装置_温州技师学院_201910988267.9

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

跨相关技术

数据要素多中心跨链标识方法_成都边界元科技有限公司_202410414905.7

一种跨水气界面运动的航行器_山东省科学院海洋仪器仪表研究所_202410410862.5

一种跨路母线金具_中国电建集团青海省电力设计院有限公司_202322246790.9

历史建筑跨模态检索方法、系统及介质_华中科技大学_202410115258.X

制动液压控制装置及跨乘型车辆_罗伯特·博世有限公司_202280065972.1

用于跨群组沟通的通信方法及系统_北京鼎诚世通科技有限公司_202410109377.4

无监督跨模态行人检索方法和装置_中国地质大学(武汉)_202410083022.2

基于跨频耦合的多频段自适应同步调制刺激系统和方法_首都医科大学宣武医院_202410073893.6

亚跨声速进发直连风洞试验模型支撑装置及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420409.2

南方教学楼装配式加跨交错桁架结构_华侨大学_202410324398.8

文书相关技术

基于信息共享的文书开具方法、系统、设备和介质_杭州威灿科技有限公司_202410248918.1

基于小样本学习的法律文书粗细粒度结构化方法和装置_四川启睿克科技有限公司_202410066663.7

基于知识图谱的法律文书生成方法、装置、设备及介质_平安国际智慧城市科技股份有限公司_202111137344.3

一种基于数据增强与改进小样本学习的法律文书命名实体识别方法_浙江警察学院_202410326482.3

基于文本脚本的法律文书数据组装共享管理系统及方法_之初科技(广州)有限公司_202410216468.8

一种法律文书自动生成系统_浙江法之道信息技术有限公司_202310547961.3

一种规范文书中被选中项确定方法及装置_鼎富智能科技有限公司_202011412921.0

案件质控图谱建立、案件文书质检方法、设备及存储介质_共道网络科技有限公司_202310227639.2

一种省力盲文书写笔_中国盲文出版社_202321770699.0

一种用于法律判决文书的长文本生成式摘要方法_桂林电子科技大学_202410081176.8

法律相关技术

基于小样本学习的法律文书粗细粒度结构化方法和装置_四川启睿克科技有限公司_202410066663.7

基于知识图谱的法律文书生成方法、装置、设备及介质_平安国际智慧城市科技股份有限公司_202111137344.3

基于法规文本的法律规则图谱构建方法及系统_北京法意科技有限公司_202110744524.1

便携式未成年人保护法律宣传装置_山东潍坊烟草有限公司_202322348686.0

一种基于数据增强与改进小样本学习的法律文书命名实体识别方法_浙江警察学院_202410326482.3

基于文本脚本的法律文书数据组装共享管理系统及方法_之初科技(广州)有限公司_202410216468.8

法律知识自动化学习系统及方法_黑龙江大学_202310788521.7

一种法律文书自动生成系统_浙江法之道信息技术有限公司_202310547961.3

一种基于知识图谱的大数据法律监督线索发现方法_北京航天长峰科技工业集团有限公司_202211340815.5

一种基于人工智能算法的法律知识增强检索系统及方法_武汉百智诚远科技有限公司_202311799732.7

龙图腾网&IPTOP

【发明授权】一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法_大连理工大学_202010654090.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务