买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种用于知识图谱嵌入模型的负采样方法_电子科技大学;电子科技大学(深圳)高等研究院;广州大学_202211455237.X 

申请/专利权人:电子科技大学;电子科技大学(深圳)高等研究院;广州大学

申请日:2022-11-21

公开(公告)日:2024-04-23

公开(公告)号:CN115774788B

主分类号:G06F16/36

分类号:G06F16/36;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2023.03.28#实质审查的生效;2023.03.10#公开

摘要:本发明公开了一种用于知识图谱嵌入模型的负采样方法,包括以下步骤:S1:初始化n个包含N个负样本的存储空间;S2:根据给定的正样本三元组,基于实体集合ε中全部实体生成负样本集合,通过均匀采样,从负样本集合中采样得到2*N1个负样本;S3:将步骤S2得到的若干个负样本添加至所储空间;S4:对存储空间中的负样本进行重要性评估;S5:对存储空间中所有负样本的重要性进行排序,保留重要性分数高的N3个样本;S6:从保留的负样本中均匀采样N个负样本组成HNS;S7:重复步骤S2‑S6n次;S8:对模型进行迭代训练。本发明提供的技术方案占用资源少,运行效率高,广泛适用于各种知识图谱模型。

主权项:1.一种用于知识图谱嵌入模型的负采样方法,其特征在于,包括以下步骤:步骤S1:在进行嵌入模型的第一次训练之前,根据输入模型的正样本Xi,初始化n个存储空间Space_i;步骤S2:根据给定的正样本三元组Xi=h,r,t,基于实体集合ε中全部实体生成负样本集合,通过均匀采样,从负样本集合中采样得到若干个负样本;步骤S3:将所述步骤S2得到的若干个负样本添加至所述存储空间Space_i;步骤S4:对所述存储空间Space_i中的负样本进行重要性Pi评估;步骤S5:对所述存储空间Space_i中所有负样本的重要性Pi进行降序排序,保留重要性分数较高的若干个样本,存储于所述存储空间Space_i;步骤S6:从所述步骤S5保留的负样本中均匀采样若干个负样本组成HNS=h',r,t'并将所述存储空间Space_i更新为HNS;步骤S7:对步骤S2-S6重复n次,n个正样本分别得到对应的n个所述存储空间Space_i,将n个正样本集合和n个负样本集合输入模型完成一次训练;步骤S8:模型的当前轮次训练完成后,在下一次迭代训练开始之前,重复步骤S2-S7,直到迭代训练次数达到设置的次数或模型性能表现稳定;所述步骤S1中所述正样本Xi中i=1,2,3……n;n个所述存储空间Space_i中i=1,2,3……n;每一个所述存储空间Space_i包括N个负样本;其中,存储空间Space_i与正样本Xi一一对应;所述步骤S2通过均匀采样从h',r,t和h,r,t'中分别采样N1个负样本,得到2*N1个负样本,其中,负样本统一表示为h',r,t',此外,h',r,t中t=t',h,r,t'中h=h';所述步骤S3将所述步骤S2采样得到的2*N1个负样本添加到所述存储空间中Space_i,所述存储空间Space_i一共包含N2=N+2*N1个负样本;所述步骤S4首先计算di,di通过以下方法取平均值求得:a通过相似性函数,衡量正样本h,r,t和负样本h',r,t'之间的差异性,di=||eh-eh'||+||et-et'||,其中eh为实体h的嵌入表示形式;b通过相似性函数,衡量当前状态的嵌入模型对正样本h,r,t和负样本h',r,t'的损失函数g差异性,di=||gh,r,t-gh',r,t'||;c通过当前状态的嵌入模型对负样本h',r,t'进行打分,di=feh',er,et';通过softmax函数计算重要性程度Pi:

全文数据:

权利要求:

百度查询: 电子科技大学;电子科技大学(深圳)高等研究院;广州大学 一种用于知识图谱嵌入模型的负采样方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。