买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于大数据的专利分类方法_重庆邮电大学_202310763656.8 

申请/专利权人:重庆邮电大学

申请日:2023-06-26

公开(公告)日:2024-04-09

公开(公告)号:CN116805059B

主分类号:G06F18/2411

分类号:G06F18/2411;G06F18/214;G06N3/0464;G06N3/048;G06N3/08;G06F16/35;G06F16/33;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.10.17#实质审查的生效;2023.09.26#公开

摘要:本发明涉及自然语言处理和人工智能领域,具体涉及一种基于大数据的专利分类方法,包括获取专利文本数据并进行预处理得到预处理数据;通过Bert模型获取预处理数据中每个字的词向量,并根据词向量计算每两个字间的相似度;根据相似度构建一个图结构输入图卷积神经网络,得到一个文本融合向量表示;将文本融合向量表示输入概率化SVM分类器,得到预处理数据的分类结果。

主权项:1.一种基于大数据的专利分类方法,其特征在于,包括以下步骤:S1.获取专利文本数据并进行预处理得到预处理数据;S2.通过Bert模型获取预处理数据中每个字的词向量,并根据词向量计算每两个字间的相似度;S3.根据相似度构建一个图结构输入图卷积神经网络,得到一个文本融合向量表示;步骤S3根据相似度构建一个图结构,包括:S301.将预处理数据中每个字看作一个节点,采用对应的词向量作为每个节点的特征向量,将每两个字间的相似度作为对应两个节点间的特征相似度;S302.设置边连接阈值,若两个节点间的特征相似度大于边连接阈值,则将这两个节点连接起来,并采用特征相似度作为边权重;S303.通过混合池函数获取每个节点的混合池特征向量,表示为: 其中,hi′表示第i个节点vi的混合池特征向量,Ki,j表示第i个节点vi与第j个节点vj的特征相似度,hj表示第j个节点vj的的特征向量,Ni表示第i个节点vi的邻居节点集合,hmean表示节点vi的所有邻居节点的平均池特征向量;S304.将每个节点的特征向量和混合池特征向量拼接,得到每个节点的融合向量,最终得到图结构;步骤S3将一个图结构输入图卷积神经网络得到一个文本融合向量表示,包括:S311.获取图结构中每个节点在图卷积神经网络的第l层的向量表示;S312.对于图结构中第i个节点vi,根据向量表示计算节点vi与其每一个邻居节点在第l层的上下文相似度;S312.根据上下文相似度计算节点vi在第l层的激活函数权重;S313.采用激活函数权重计算更新节点vi的向量表示;S314.直至图结构中所有节点的向量表示更新完成,判断每个节点的向量表示的变化量绝对值是否都小于变化阈值,若不是,则执行步骤S315;若是,则执行步骤S316;S315.判断当前层数l是否小于最大层数,若满足,则令l=l+1并返回步骤S311;若不满足,则执行步骤S316;S316.输出图结构中所有节点当前的向量表示并进行混合池化,得到一个文本融合向量表示;S4.将文本融合向量表示输入概率化SVM分类器,得到预处理数据的分类结果。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种基于大数据的专利分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。