买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于细粒度匹配的零样本关系抽取方法_复旦大学;上海高德威智能交通系统有限公司_202211234538.X 

申请/专利权人:复旦大学;上海高德威智能交通系统有限公司

申请日:2022-10-10

公开(公告)日:2024-04-19

公开(公告)号:CN117910475A

主分类号:G06F40/30

分类号:G06F40/30;G06F40/289;G06F40/211;G06F18/22;G06F18/241;G06F18/213

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.07#实质审查的生效;2024.04.19#公开

摘要:本发明提供一种基于细粒度匹配的零样本关系抽取方法,首先人工设计关系描述,标注对应的头尾实体类别,针对关系描述中多实体类别的情况,提出了基于相关词扩充融合模版句子生成方法,丰富关系描述中的实体类别信息,且拉近编码器与孤立实体类别间的间隔,获得了更好的实体类别表示,提升匹配精度。其次,通过带有梯度反转的分类器和基于自注意力机制的特征提取方法,利用投影蒸馏的去除原始语句中关系无关的冗余信息,获得纯净的关系语义表示,进一步提升匹配精度。最后基于双塔结构的思路,利用cos相似度作为度量指标,对关系描述和原始语句进行细粒度结构化匹配,使实体与实体进行匹配,句子与句子匹配,避免双塔结构预编码特性带来的精度损失。

主权项:1.一种基于细粒度匹配的零样本关系抽取方法,其特征在于,包括以下步骤:步骤S1,为所需抽取的零样本关系类别人工设计对应的关系描述,并显式标注出每个关系描述对应的头尾实体类别,再对头尾实体类别进行扩充;步骤S2,将所述关系描述以及对应的头尾实体类别输入到预先训练过的关系描述编码器中,得到关系描述的头尾实体特征表示,并存储起来;步骤S3,对原始语句中的头尾实体进行实体标记处理后,输入到经过预训练的特征提取网络中,得到原始语句的词元特征表示、句子特征表示以及原始语句中的实体对特征表示;步骤S4,将所述词元特征表示输入至文本关系特征蒸馏网络,通过梯度反转以及投影方式的方法,结合自注意力机制对原始语句中关系无关的语义内容进行蒸馏,得到原始语句中表示关系内容的句子关系特征表示;步骤S5,将实体对特征表示与蒸馏得到的句子关系特征表示输入至文本匹配模块,分别与所述关系描述以及所述头尾实体特征表示进行显式的结构化细粒度匹配,得到原始语句与对应关系描述之间的总相似度。

全文数据:

权利要求:

百度查询: 复旦大学;上海高德威智能交通系统有限公司 一种基于细粒度匹配的零样本关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。