申请/专利权人:北京邮电大学
申请日:2021-09-09
公开(公告)日:2023-05-23
公开(公告)号:CN113704415B
主分类号:G06F16/33
分类号:G06F16/33;G06F40/289;G06F40/30;G06N3/04;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2023.05.23#授权;2021.12.14#实质审查的生效;2021.11.26#公开
摘要:本发明实施例涉及计算机技术领域,特别涉及一种医学文本的向量表示生成方法和装置,该方法包括:构建医学文本的单一粒度图和与每一个单一粒度图对应的第一邻接矩阵;基于第一邻接矩阵,利用预设的图神经网络模型对每一个单一粒度图进行多次迭代操作,得到该单一粒度图中各节点的第一向量表示;拼接每一个单一粒度图中各节点的第一向量表示,得到各节点自身的第二向量表示;基于不同单一粒度图的节点的包含关系,确定多粒度图的第二邻接矩阵;基于第二邻接矩阵,利用图神经网络模型对多粒度图进行多次迭代操作,得到多粒度图中各节点的目标向量表示。本方案能够增强文本表征的信息丰富程度,以提升医学文本表征的鲁棒性。
主权项:1.一种医学文本的向量表示生成方法,其特征在于,包括:构建医学文本的单一粒度图和与每一个单一粒度图对应的第一邻接矩阵;其中,所述单一粒度图包括字符粒度图、单词粒度图和术语粒度图,每一个单一粒度图均包括多个节点和多条边,每条边连接于两个所述节点之间,所述第一邻接矩阵是基于与该第一邻接矩阵对应的单一粒度图中每一条边的权重确定的;基于所述第一邻接矩阵,利用预设的图神经网络模型对每一个单一粒度图进行多次迭代操作,得到该单一粒度图中各节点的第一向量表示;其中,每一个单一粒度图中各节点的第一向量表示是聚合该单一粒度图中各节点自身的向量表示和各阶邻居节点的向量表示得到的;拼接每一个单一粒度图中各节点的第一向量表示,得到各节点自身的第二向量表示;基于不同单一粒度图的节点的包含关系,确定多粒度图的第二邻接矩阵;其中,所述多粒度图是通过对所有单一粒度图进行重构得到的,所述多粒度图包括每一个单一粒度图中的所有节点,所述多粒度图包括的边是基于不同单一粒度图的节点的包含关系得到的;基于所述第二邻接矩阵,利用所述图神经网络模型对所述多粒度图进行多次迭代操作,得到所述多粒度图中各节点的目标向量表示;其中,所述多粒度图中各节点的目标向量表示是聚合所述多粒度图中各节点自身的第二向量表示和各阶邻居节点的第二向量表示得到的。
全文数据:
权利要求:
百度查询: 北京邮电大学 医学文本的向量表示生成方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。