【发明授权】一种争议焦点体系构建与识别方法_中国司法大数据研究院有限公司_202310028014.3

导航：龙图腾网> 最新专利技术> 一种争议焦点体系构建与识别方法_中国司法大数据研究院有限公司_202310028014.3

申请/专利权人：中国司法大数据研究院有限公司

申请日：2023-01-09

公开（公告）日：2023-09-12

公开（公告）号：CN116304019B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/211;G06F40/289;G06Q50/18

优先权：

专利状态码：有效-授权

法律状态：2023.09.12#授权;2023.07.11#实质审查的生效;2023.06.23#公开

摘要：本发明公开了一种争议焦点体系构建与识别方法。本方法步骤包括：1对裁判文书集中的每一裁判文书进行分段处理，得到裁判文书的事实认定段和裁判说理段集合D；2从集合D中筛选出蕴含争议焦点的事实认定段和裁判说理段，得到蕴含争议焦点的数据集D1；从数据集D1中提取争议焦点语句，得到争议焦点数据集D2；3对数据集D2进行聚类，形成争议焦点语句聚类簇；4结合相关法律知识对聚类结果进行归纳总结，形成多层级争议焦点知识体系；5结合知识体系对裁判文书集中的裁判文书进行标注，得到争议焦点知识体系识别模型；6当给定一篇裁判文书A，提取裁判文书A中的争议焦点语句并将其输入该模型，识别出裁判文书A的争议焦点。

主权项：1.一种争议焦点体系构建与识别方法，其步骤包括：1对裁判文书集中的每一裁判文书进行分段处理，得到裁判文书的事实认定段和裁判说理段集合D；2从所述事实认定段和裁判说理段集合D中筛选出蕴含争议焦点的事实认定段和裁判说理段，得到蕴含争议焦点的数据集D1；从所述数据集D1中提取争议焦点语句，得到争议焦点数据集D2；3对所述争议焦点数据集D2进行聚类，形成争议焦点语句聚类簇；4结合相关法律知识对聚类结果进行归纳总结，形成多层级争议焦点知识体系；5结合所述多层级争议焦点知识体系对裁判文书集中的裁判文书进行标注，得到争议焦点知识体系识别模型；构建所述争议焦点知识体系识别模型的方法为：51结合所述多层级争议焦点知识体系对裁判文书集中的一部分裁判文书进行标注，标注的数据集记为Ak；其中k代表案由编号；52根据数据集Ak及Ernie预训练模型生成争议焦点中心向量：对第l个标签，获取数据集Ak中具有该第l个标签的pkl个争议焦点标注数据，对应的争议焦点内容集合记为L为标签总数；利用Ernie预训练模型对Ckl数据集中的样本生成表示向量并求均值，获得第l个标签的中心点向量计算中心向量到第l个标签下各争议焦点向量的距离，取最大值作为第l个标签的阈值λkl；53对未标注的争议焦点数据集进行标注，分为粗标注和精标注：首先通过Ernie预训练模型将未标注文本转化为向量，争议焦点文本数据对应的向量记为然后计算向量和案由k下所有标签的中心向量的余弦距离，按距离进行排序，筛选距离最小的前n个中心向量对应的标签作为第一轮标签识别，距离记作d1,…,dn，对应的标签记为l1,…,ln，此过程记作粗标注；然后基于粗标注的结果进行精标注，对于选中的n个标签，通过计算n个标签对应的阈值与粗标注中计算得到的距离d1,…,dn做差并除以阈值，得到若θj均小于0，则认为当前争议焦点文本数据不蕴含标签lj，若存在θj大于或等于0，则选取θj最大值所对应的标签作为当前争议焦点文本数据的标签；最终争议焦点数据集Fk中的文本被打上0个或者1个标签；其中nk表示未标注的争议焦点总数；54通过对步骤53得到的标注数据进行校验，重新生成各个标签的中心点向量及其阈值，采用53中粗标注和精标注方式，对新增争议焦点文本进行标注，得到争议焦点知识体系识别模型；6当给定一篇裁判文书A，提取该裁判文书A中的争议焦点语句并将其输入所述争议焦点知识体系识别模型，识别出该裁判文书A的争议焦点。

全文数据：

权利要求：

百度查询：中国司法大数据研究院有限公司一种争议焦点体系构建与识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

下一篇：一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

相关技术

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种实验室地层品质因子估算方法_中国石油化工股份有限公司_202211297976.0

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

体系相关技术

一种装配式围檩体系_广州宏途设备工程有限公司_202321426756.3

一种支撑体系结构_中建六局土木工程有限公司_202022879563.6

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种自平衡伞壳体系及形成方法_中国建筑设计研究院有限公司_202211011957.7

一种活性原油封堵体系及其制备方法和应用_中国石油大学(北京)_202311072736.5

一种自适应土层承载力要求的结构平台体系_煤炭工业合肥设计研究院有限责任公司_201910092510.9

一种面向任务的运载火箭体系贡献率计算方法_中国人民解放军63921部队_202211592505.2

基于软件通信体系结构的数据传输方法_成都谐盈科技有限公司_202410063128.6

用于检测外泌体miRNA的MDTs-CHA体系、电化学传感器及其应用_南方医科大学南方医院_202110078844.8

一种硫酸长春新碱三元溶剂体系下的程序性干燥方法_广州白云山汉方现代药业有限公司_202211334763.0

构建相关技术

主动安全网络及构建方法_北京北信源软件股份有限公司_202210505613.5

索引构建方法、装置、电子设备和介质_中国工商银行股份有限公司_202010939115.2

数据库应用界面自动构建方法_慧新全智工业互联科技(青岛)有限公司_202410022812.X

虚拟形象构建方法、装置、设备和存储介质_北京百度网讯科技有限公司_202310233774.8

一种北方寒冷地区建筑屋顶水池防冻系统及其构建方法_中国建筑设计研究院有限公司_202311478224.9

一种卫星管理任务的构建方法及相关设备_北京航天驭星科技有限公司_202310124807.5

一种乳腺癌模型猪的构建方法及应用_南京启真基因工程有限公司_202110187956.7

一种数字化环境下可靠性构建方法_北京机电工程研究所_202011617960.4

一种慢性病临床决策支持系统及构建方法_盐城市第三人民医院_202311426483.7

构建车体结构与乘员损伤评价的关联模型的方法、装置和设备_广州汽车集团股份有限公司_201910658639.1

识别相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

拉丝枪自动识别电路、识别方法及电焊机系统_深圳市瑞凌实业股份有限公司_201711345496.6

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

标签识别网络的训练方法、标签识别装置/方法及设备_京东方科技集团股份有限公司_201811353105.X

文字识别模型训练及其识别方法、装置、设备和介质_北京百度网讯科技有限公司_202310002789.3

一种楼宇门禁识别器_江苏卓茂智能科技有限公司_202322029488.8

基于称重的手卫生识别装置_昂科信息技术(上海)股份有限公司_202322729429.1

语音识别歧义消除方法及装置_青岛海尔电冰箱有限公司_202211290249.1

识别传感器及其控制方法、汽车、车辆用灯具、对象识别系统、对象的识别方法_株式会社小糸制作所_201880053552.5

一种用于唇语识别的智能手环、唇语识别系统及方法_中国银行股份有限公司_202010916908.2

龙图腾网&IPTOP

【发明授权】一种争议焦点体系构建与识别方法_中国司法大数据研究院有限公司_202310028014.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务