【发明授权】一种基于分布校准的小样本实体关系抽取方法_湖南大学_202111613756.X

导航：龙图腾网> 最新专利技术> 一种基于分布校准的小样本实体关系抽取方法_湖南大学_202111613756.X

申请/专利权人：湖南大学

申请日：2021-12-27

公开（公告）日：2024-04-09

公开（公告）号：CN114328921B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/216;G06F40/289;G06F18/241;G06F18/22;G06N3/0464;G06N3/0455;G06N3/0442

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要：本发明公开了一种基于分布校准的小样本实体关系抽取方法，其假设特征向量中的每个维度都遵循高斯分布，并观察到相似类通常具有相似的特征表示均值和方差。因此，高斯分布的平均值和方差可以在类似的类别之间传递。同时，当有足够的样本时，可以更准确地估计统计数据。因此，重用来自多个类的分布统计量，并根据它们的类相似性可以更好地校准少数类的分布统计量，根据校准后的分布统计量可以生成更多的样本。本发明的有益效果：使提取的特征更丰富；可以减少分散偏度，能够让特征向量分布更接近高斯分布；大大减少了由于数据过少引起的过拟合问题，通过数据增强实现了关系抽取准确度的提高；能够极大地提高模型的泛化能力。

主权项：1.一种基于分布校准的小样本实体关系抽取方法，其特征在于，应用于提取文本信息，该方法包括如下步骤：步骤一、提供一包含多个关系类别的数据集，并将该数据集按类别划分出训练集和测试集，其中，训练集包含的类别多于测试集包含的类别，每个类别包含多个样本，所述数据集为包含80个关系类别的大规模人工标注数据集FewRel；步骤二、将训练集作为基类，测试集作为新类，使用BERT模型将基类和新类中各类别所包含的样本进行向量化，提取样本的特征向量，从而将训练集转化为基类特征向量集，将测试集转化为新类特征向量集；步骤三、通过公式（1）和（2）分别计算来自基类中的类别i的特征平均值和特征协方差矩阵，从而得出基类特征向量集的分布统计量；（1）（2）其中，是基类中的类别i的第j个样本的特征向量，j为大于0的自然数；是类别i中的样本总数；步骤四、使用基于Episode的元任务训练策略训练分类器，每轮从新类特征向量集选取N个类别，从每个类别中分别抽取K个样本作为支持集，抽取Q个样本作为查询集，其中，N、K、Q均为大于0的自然数；步骤五、通过Tukey幂阶变换将步骤四获得的支持集和查询集的特征向量通过公式（3）进行映射，得到特征向量；（3）其中，是一个超参数，用于调整如何校准统计分布量；步骤六、通过公式（4）和（5）判断基类中所有类别包含的特征平均值和新类的支持集包含的特征向量的相似度，基于该相似度选择出基类中所有类别包含的特征平均值和新类的支持集包含的特征向量最相似的前k个类别；（4）（5）其中，为特征向量与基类中所有类别包含的特征平均值计算距离的输入距离集，·为从输入距离集中选择最近的k个元素的运算符；为存储距离特征向量的前k个最近的基类的类别；为支持集中的一个特征向量；为基类特征向量集；步骤七、基于步骤六中选择的前k个类别的特征平均值和特征协方差矩阵，通过公式（6）和（7）校准支持集包含的特征向量的分布统计量；（6） 7其中，是一个超参数，决定从分布统计量中采样的特征向量的分散程度；步骤八、通过公式（8）和（9）从支持集中的类别y的一组通过步骤七校准后的分布统计量中采样θ个带有标签y的特征向量扩充训练数据；（8）（9）其中，，分别是类别y中第K个特征向量校准后的特征平均值和特征协方差矩阵；K为支持集中每个类别的样本数量；步骤九、将步骤八采样得到的特征向量与新类支持集中的特征向量共同作为分类器的训练数据，通过最小化采样得到的样本和支持集的样本的交叉熵损失来训练分类器；步骤十、使用通过步骤九训练后的分类器对新类查询集的样本进行预测。

全文数据：

权利要求：

百度查询：湖南大学一种基于分布校准的小样本实体关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

下一篇：一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

相关技术

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

关系相关技术

基于多层标注策略的跨境民族文化实体关系抽取方法及装置_昆明理工大学_202210733201.7

具有分层保护机制的半导体装置及相关系统、装置及方法_美光科技公司_201880069079.X

一种阻隔帷幕复电阻率信号与渗透性关系的确定方法_北京建工环境修复股份有限公司_202310924264.5

一种研究起重用滚动轴承载荷-温度关系的试验装置_河南科技学院_202420524687.8

在对称双块结构中的沟槽中具有有源源极/漏极触点的微电子装置及相关系统及方法_美光科技公司_202280056566.9

安全开关以及开关系统_松下知识产权经营株式会社_202110310253.9

机械轴环以及相关系统和方法_詹姆斯奥林顿二世专业牙科公司_202280058200.5

关系指数显示方法、装置、介质和计算设备_杭州网易云音乐科技有限公司_202410060074.8

基于远程监督关系抽取的肝癌信息标注系统_杭州电子科技大学_202311787038.3

一种实体关系的抽取方法和装置_北京捷通华声科技股份有限公司_202010519899.3

实体相关技术

基于多层标注策略的跨境民族文化实体关系抽取方法及装置_昆明理工大学_202210733201.7

一种基于文本的实体识别方法及相关装置_广东工业大学_202010844442.X

边缘物联代理实体的配网方法、系统及设备_成都汉度科技有限公司_202311205649.2

实体消歧方法、装置、电子设备及计算机可读存储介质_广州视源电子科技股份有限公司_202011280340.6

线状基础地理实体与专题地理实体边界融合方法及系统_湖南省第一测绘院_202410291864.7

同义实体对的确定方法及装置_阿里巴巴集团控股有限公司_201910299911.1

与IOT设备构建增强现实体验_斯纳普公司_202280058737.1

一种实体关系的抽取方法和装置_北京捷通华声科技股份有限公司_202010519899.3

一种基于文本图像的多模态命名实体识别方法_福建理工大学_202410080441.0

多任务序列标注的药物实体和相互作用联合抽取方法_电子科技大学_202210628078.2

样本相关技术

一种采集蜱虫样本的采集管_新疆畜牧科学院兽医研究所(新疆畜牧科学院动物临床医学研究中心)_202322726868.7

一种新鲜肿瘤组织样本恒温保存装置_杭州铂赛生物科技有限公司_202322416116.0

一种方便使用生殖样本取出组件_华中科技大学同济医学院附属协和医院_202322575048.2

训练样本处理方法、跨模态匹配方法、装置、设备和介质_北京百度网讯科技有限公司_202211668247.1

一种流水线分析系统及样本转接系统_基蛋生物科技股份有限公司_202322354979.X

样本构建方法、代码生成方法、电子设备及存储介质_阿里云计算有限公司_202410033070.0

基于人工智能的样本增广方法、装置及电子设备_腾讯科技(深圳)有限公司_202410076172.0

基于深度编码网络的SAR目标识别对抗样本生成方法_中山大学_202110483002.0

一种训练数据集独立的单样本图像分割方法和系统_华南理工大学_202111253132.1

基于改进TimeGan模型的小样本数据故障诊断方法_西安理工大学_202110950739.9

龙图腾网&IPTOP

【发明授权】一种基于分布校准的小样本实体关系抽取方法_湖南大学_202111613756.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务