买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于图片序列识别的法院材料电子目录编排方法_南京通达海软件有限公司_202311709481.9 

申请/专利权人:南京通达海软件有限公司

申请日:2023-12-13

公开(公告)日:2024-03-08

公开(公告)号:CN117669510A

主分类号:G06F40/166

分类号:G06F40/166;G06V30/41;G06V30/42;G06V10/74;G06V10/764;G06V10/82;G06F18/213;G06F18/25;G06F18/24;G06F16/33;G06N3/045;G06N3/0442;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种基于图片序列识别的法院材料电子目录编排方法,主要拆分编目工作,序列模型不仅仅使用单个图片信息提取首页,同时也使用了文本信息和前后文信息,再对首页使精心开发的标题抽取模型抽取标题。这样高了编目系统健壮性和效率。这个系统可以广泛应用于法院和类似领域,有望提高电子目录编排的质量和效率。

主权项:1.一种基于图片序列识别的法院材料电子目录编排方法,其特征在于步骤包括:1序列建模:引入了序列模型,将送交的扫描件看作一个序列,以建模每张图片的前后关系;2对所有材料图片进行二分类,即仅判断每张图片是首页还是子页;3将图片序列做编码,提取图片的版面特征和文本特征,将版面特征和文本特征连接在一起,形成一个多维特征向量;4学习融合后特征的表示,将融合后的多模态特征输入到序列模型中,所述序列模型将学习如何有效地编码多模态信息,并捕获图片序列中的上下文关系;5使用已标记的数据对序列模型进行训练;6将输入的图片序列送入已训练好的模型,模型将为每个图片标注为材料的首页或子页;7对于每个材料的首页,使用标题检测模型检测标题;若当前的材料图片没有标题,通过对当前材料图片与标准材料库中的每个材料计算图片相似度,若相似度大于阈值,则将标准材料库中最相似的图片标题当作当前材料的标题,否则提示用户出现新的材料,让用户来判断。

全文数据:

权利要求:

百度查询: 南京通达海软件有限公司 一种基于图片序列识别的法院材料电子目录编排方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。