Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜江苏大道云隐科技有限公司顾程熙获国家专利权

恭喜江苏大道云隐科技有限公司顾程熙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜江苏大道云隐科技有限公司申请的专利一种非结构化文档溯源方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119670751B

龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411740159.7,技术领域涉及:G06F40/295;该发明授权一种非结构化文档溯源方法和系统是由顾程熙设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。

一种非结构化文档溯源方法和系统在说明书摘要公布了:本发明公开了一种非结构化文档溯源方法和系统,其中,该非结构化文档溯源方法包括以下步骤:S1,识别待溯源的第一非结构化文档的第一结构化特征,并识别目标系统中第二非结构化文档的第二结构化特征;S2,将所述第一结构化特征与所述第二结构化特征进行特征比较;S3,根据特征比较结果判断所述第一非结构化文档是否来源于所述目标系统。根据本发明的非结构化文档溯源方法,通过识别非结构化文档的结构化特征,能够有效地对非结构化文档进行溯源。

本发明授权一种非结构化文档溯源方法和系统在权利要求书中公布了:1.一种非结构化文档溯源方法,其特征在于,包括以下步骤: S1,获取命名实体识别模型,并根据所述命名实体识别模型识别待溯源的第一非结构化文档的第一结构化特征,并识别目标系统中第二非结构化文档的第二结构化特征;其中,步骤S11中获取所述命名实体识别模型,包括: S101,从历史文档数据库中获取包含命名实体特征的待训练文档集合; S102,对所述待训练文档集合中每个待训练文档进行文本切分处理,得到每个所述待训练文档对应的第一词汇集,并根据所述命名实体特征将所述第一词汇集归纳为命名实体集和非命名实体集; S103,将所述待训练文档集合输入命名实体识别网络中,并输出将所述待训练文档集合中每个待训练文档对应的命名实体集中每个词汇预测为命名实体的第一概率值,以及将所述非命名实体集中每个词汇预测为命名实体的第二概率值; S104,根据所述第一概率值和所述第二概率值获取第一代价函数,并基于所述第一代价函数调整所述命名实体识别网络中各参数,以获取所述命名实体识别模型;其中,步骤S104具体包括: S141,根据所述第一概率值和所述第二概率值通过以下公式生成第二代价函数: , 其中,表示所述第二代价函数,为第k个待训练文档的命名实体集中第a个词汇对应的第一概率值,为第k个待训练文档的非命名实体集中第b个词汇的第二概率值,为所述待训练文档集合中待训练文档的个数,为第k个待训练文档的命名实体集中词汇的个数,为第k个待训练文档的非命名实体集中词汇的个数; S142,对所述第二代价函数进行校准,并通过以下公式生成校准后的所述第一代价函数: , 其中,表示所述第一代价函数,为第k个待训练文档的命名实体集中个值最小的词汇的第一概率值的均值,为第k个待训练文档的命名实体集中个值最大的词汇的第二概率值的均值,和为常量; S2,将所述第一结构化特征与所述第二结构化特征进行特征比较; S3,根据特征比较结果判断所述第一非结构化文档是否来源于所述目标系统。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏大道云隐科技有限公司,其通讯地址为:213022 江苏省常州市新北区太湖东路9号3幢220-43室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。