【发明授权】一种基于多层注意力机制的远程监督关系抽取方法_北京理工大学_202110453297.7

导航：龙图腾网> 最新专利技术> 一种基于多层注意力机制的远程监督关系抽取方法_北京理工大学_202110453297.7

申请/专利权人：北京理工大学

申请日：2021-04-26

公开（公告）日：2022-09-20

公开（公告）号：CN113076391B

主分类号：G06F16/31

分类号：G06F16/31;G06F40/30;G06N5/02;G06N3/04;G06N3/08

优先权：["20210127 CN 2021101120392"]

专利状态码：有效-授权

法律状态：2022.09.20#授权;2021.07.23#实质审查的生效;2021.07.06#公开

摘要：本发明涉及一种基于多层注意力机制的远程监督关系抽取方法，属于人工智能和自然语言处理技术领域。本方法为了解决现有的远程监督关系抽取方法在噪声环境下抽取效果差、忽略对句子包的噪声处理以及句子中实体重复出现等技术问题，针对句子中实体对重复出现的情况，设计一种相对位置特征注意力，充分利用实体对的位置信息。针对句子包噪声问题，通过计算每个句子包的置信度，根据置信度将具有相同关系的噪声大的句子包和噪声小的句子包组合成包组，使得包组间的噪声相对平衡，提高噪声环境下关系抽取的效果。

主权项：1.一种基于多层注意力机制的远程监督关系抽取方法，其特征在于，包括以下步骤：S1：获取知识库，将知识数据集中的句子按包进行划分；S2：获取句子的矩阵表示：首先，令数据集中第i个包其中，表示包Bi的最后一个句子；令包Bi中第j个句子其中，lij表示句子的词语数量；令句子的头实体的位置为其中，为头实体出现的次数；令句子的尾实体的位置为其中，为尾实体出现的次数；然后，将头实体位置和尾实体位置进行组合得到其中对于句子中的每一个单词利用Embedding技术，计算其所有的位置特征：其中，表示单词相对于头实体的第个位置特征向量，表示单词相对于尾实体的第个位置特征向量，表示实数域内维度为dp的向量空间；通过公式1，计算词语的中最终向量表示集合其中：其中，表示集合中的第l个向量，是词语的嵌入式词向量，表示实数域内维度为dw的向量空间，d表示最终向量表示维度，d＝dw+2dp，其中，dw表示嵌入式词向量的维度，dp表示位置特征向量的维度；通过公式2，计算句子矩阵表示集合其中：其中，表示集合的第l个矩阵，表示句子的第k个词语的第l个最终向量表示，1≤k≤lij,lij为句子的词语数量；S3：通过句子编码器，获取句子的特征向量；对于句子的每一个矩阵表示用一个含有m个卷积核{f1，f2，...，fm}的分段卷积神经网络，得到X的向量表示，其中，fm表示第m个卷积核，每一个卷积核1≤i≤m，表示实数域内尺寸为l*k的矩阵空间，l表示卷积核的长度，k表示卷积核的宽度，表示矩阵集合的第l个矩阵，首先，通过m个卷积核提取卷积特征cij：cij＝fi*wj-l+1：j3其中，1≤i≤m，1≤j≤|X|+l-1，wj-l+1：j表示矩阵X的第j-l+1行到第j行对应向量构成的矩阵，|X|表示矩阵表示X的行数；*为卷积操作；经过卷积后，得到矩阵然后，对于每个卷积核fi对应的卷积结果ci，按照句子中的两个实体位置划分成三部分{ci1，ci2，ci3}，分别为句头到头实体之间的部分，头实体到尾实体之间的部分，尾实体到句尾的部分，并进行分段最大池化操作：pij＝maxcij4其中，1≤i≤m，1≤j≤3；每个卷积核fi对应一个3维向量pi＝{pi1，pi2，pi3}；所有卷积核对应向量拼接得到向量通过tanh函数，得到矩阵X最终向量表示：s＝tanhp1：m5其中，ds＝3m，ds表示矩阵X最终向量表示的维度，此时，句子S对应的向量表示与其长度无关；对于句子的个矩阵表示通过公式3、4、5，得到个对应的特征向量S4：通过位置特征注意力，得到句子的权重性向量表示：对于句子通过公式6，得到其权重性特征向量其中，αk为的权重，通过公式7计算得到：其中，ek表示向量与句子的对应关系的匹配分数，el表示句子的特征向量集合中第l个向量与句子的对应关系的匹配分数；ek通过公式8计算得到：其中，为句子的对应关系通过Embedding技术得到的嵌入向量；S5：通过句子注意力，得到包的向量表示；S6：将数据集的包组合成包对；S7：获取每一个包对的向量表示；S8：获取包对的损失值；S9：通过反向传播和梯度下降，对模型参数进行更新；S10：根据训练好的模型，针对未标注的包预测该包的关系，获得新的三元组知识，从而挖掘出包中句子的语义信息。

全文数据：

权利要求：

百度查询：北京理工大学一种基于多层注意力机制的远程监督关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：指示信息发送、接收方法和装置、通信装置及存储介质_北京小米移动软件有限公司_202280002814.1

下一篇：门栏推力及平行度测试机及测试方法_宁波柯尼金属制品有限公司_202410013833.5

相关技术

指示信息发送、接收方法和装置、通信装置及存储介质_北京小米移动软件有限公司_202280002814.1

门栏推力及平行度测试机及测试方法_宁波柯尼金属制品有限公司_202410013833.5

一种VTI介质的叠前各向异性反演方法及装置_中国石油化工股份有限公司_202211211192.1

一种用于输送线的自动取样装置_河南黄河新材料科技有限公司_202410231803.1

一种跳过无效节目的方法及显示设备_VIDAA国际控股(荷兰)公司_202211177384.5

一种基于拉链衫生产的高效重复剪切设备及其重复剪切方法_申洲针织(安徽)有限公司_202410021823.6

MNT在检测肺腺癌铁死亡和化疗敏感性中的应用_复旦大学附属中山医院_202311869101.8

基于磁声非线性相互作用的自旋波频率梳_电子科技大学_202410002762.9

一种自动发现数据质检规则的方法_中电数据产业有限公司_202410002269.7

一种脚本代码生成方法、装置及相关设备_星际控股集团有限公司_202311848813.1

投影成像方法及投影成像系统_中国人民解放军国防科技大学_202311858454.8

行驶数据识别方法、装置、计算机设备及存储介质_北京中交兴路信息科技股份有限公司_202311863323.9

机制相关技术

用于远程干扰管理的触发机制_高通股份有限公司_201980060508.1

一种环保加工机制砂用烘干滚筒_滕州市鑫岩石料有限责任公司_202321906661.1

具有抗干扰机制的信号输出电路及方法_瑞昱半导体股份有限公司_202010396281.2

一种机制砂分析用自动取样装置_世邦工业科技集团股份有限公司_202321295262.6

用于跨平台硬件管理代理的隔离执行机制_戴尔产品有限公司_202211180449.1

一种机制砂混凝土及制备工艺_陕西秦汉恒盛新型建材科技有限责任公司_202311829915.9

一种具有EC风机制冷循环风道结构及玻璃柜_浙江星星冷链集成股份有限公司_202410037497.8

一种融合层次注意力机制的事件预测方法_江苏海洋大学_202311782685.5

基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法_中国科学院上海微系统与信息技术研究所_202011298898.7

一类eRF3a靶向蛋白降解机制治疗人类肿瘤的药物_苏州德亘生物医药有限公司_202211216359.3

抽取相关技术

数字抽取滤波器、数字抽取滤波的方法及模数转换器、集成电路_加特兰微电子科技(上海)有限公司_202211209122.2

一种锌锅锌液快速抽取装置_甘肃西沟矿业有限公司_202322414194.7

一维信号抽取的方法和装置_康耐视公司_202110518918.5

专利中技术短语的自动抽取方法_中国科学技术大学_202010887328.5

一种长文档中的表格信息抽取方法、装置、设备及介质_达观数据有限公司_202410187438.9

一种关系抽取方法、装置、设备及可读存储介质_科大讯飞(苏州)科技有限公司_202311851383.9

一种用于养殖尾水沉淀淤泥抽取压缩装置_广东海藏生态科技有限公司_202321785106.8

一种基于问答式系统的篇章级核心事件抽取方法_河海大学_202111133607.3

一种利用重力作用使纸巾抽取不中断的纸巾架_张振宇_202410161243.7

一种基于多模态信息的航运数据抽取方法及系统_长江水上交通监测与应急处置中心_202311079498.0

关系相关技术

企业关系展示方法及相关设备_深圳赛安特技术服务有限公司_202010762817.8

用于防爆开关系统的保护系统_国家能源集团国源电力有限公司_202322281211.4

基于关系挖掘的异构图嵌入方法及系统_江南大学_202311856289.2

社交关系增强的复杂视频人物检索方法_中国科学技术大学_202110677925.X

语音转写方法、装置、相关系统及设备_阿里巴巴集团控股有限公司_201911159513.6

多渠道交互式客户关系管理系统_吉林省经济管理干部学院_202311767818.1

城市场所与呼吸道传染病传播关联关系挖掘方法_中南大学_202410002827.X

关系建立、对象识别及提示方法、装置、设备和存储介质_浙江莲荷科技有限公司_202010746547.1

一种基于日志事件图和关联关系挖掘的异常检测方法_中国科学技术大学_202110592113.5

跨代码仓库的调用关系确定方法、装置、介质及设备_北京字跳网络技术有限公司_202311869147.X

龙图腾网&IPTOP

【发明授权】一种基于多层注意力机制的远程监督关系抽取方法_北京理工大学_202110453297.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务