买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于IPC标签共现的规则检核方法及系统_知呱呱(天津)大数据技术有限公司_202410069640.1 

申请/专利权人:知呱呱(天津)大数据技术有限公司

申请日:2024-01-18

公开(公告)日:2024-02-23

公开(公告)号:CN117591969A

主分类号:G06F18/2431

分类号:G06F18/2431;G06N3/0455;G06N3/0464;G06F18/243;G06F18/26

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明公开了一种基于IPC标签共现的规则检核方法及系统,采用的IPC标签频繁模式,通过IPC规则检核算法得到满足设定置信度阈值的预测结果,提升了IPC多标签分类结果的置信度。本发明采用了IPC标签上下文模型,利用了共享同一篇专利的多个IPC标签之间具有相似性、顺序性的特点,提升预测结果的准确率。基于IPC树状层次语义关系设计父子IPC标签竞选算法,考虑了IPC体系全局的层级语义关系,有利于IPC规则检核提升IPC多标签分类结果的质量。

主权项:1.一种基于IPC标签共现的规则检核方法,其特征在于,包括:IPC国际专利分类标签频繁模式挖掘;IPC标签上下文模式挖掘;IPC规则检核;其中,所述IPC国际专利分类标签频繁模式挖掘,包括如下步骤:抽取预先准备的样本库专利文献库中的IPC标签,构建专利IPC标签数据库,计算所有IPC项的IPC支持度计数;对大于支持度计数阈值的所有IPC项按照降序排序,得到的IPC项有序列表;并构建IPC项频繁模式树;遍历并从IPC项频繁模式树获取,有序列表中所有IPC项的条件模式基,构建频繁IPC项集;遍历所述频繁IPC项集,挖掘IPC标签频繁模式关联规则,汇总所有规则形成IPC频繁模式关联规则集;所述IPC标签上下文模式挖掘包括如下步骤:构建用于模型训练的数据集;基于IPC标签上下文模型实现IPC标签上下文模式挖掘:采用所述用于模型训练的数据集,迭代更新模型参数,进行训练,得到训练好的IPC标签上下文模型;利用当前待加工专利文献的前N个IPC多标签分类结果,构建模型应用数据集;将所构建的模型应用数据集输入训练好的IPC标签上下文模型;将模型预测出的当前待加工专利文献的所有前一个IPC标签和后一个IPC标签,整理并去重得到一个IPC标签集合,用于IPC规则检核;所述IPC规则检核,包括如下步骤:输入待加工专利文献的前N个IPC多标签分类结果、所述IPC标签频繁模式关联规则集、所述IPC标签上下文模型预测的上下文IPC标签集合;将所述N个IPC多标签分类结果,与所述IPC标签上下文模型预测的上下文IPC标签集合,求并集;构建IPC标签对列表;判断当前IPC标签对是否存在对应的IPC规则且满足设定的置信度阈值,如存在则将当前IPC标签对保存到已验证的IPC标签对列表;展开所述已验证的IPC标签对列表所有IPC标签并去重,得到IPC多标签分类结果;依据IPC标签的层级关系构建父标签查询字典进行筛选;遍历父子IPC标签列表,进行轮盘赌竞选,得到获胜IPC标签列表;将得到IPC多标签分类结果中去除父子IPC标签后的所有IPC标签,所得到的获胜IPC标签列表,计算并集,得到IPC标签列表。

全文数据:

权利要求:

百度查询: 知呱呱(天津)大数据技术有限公司 一种基于IPC标签共现的规则检核方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。