买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种生物医学领域文档级关系抽取方法及系统_大连海事大学_202311630560.0 

申请/专利权人:大连海事大学

申请日:2023-11-30

公开(公告)日:2024-03-08

公开(公告)号:CN117668226A

主分类号:G06F16/35

分类号:G06F16/35;G06F16/36;G06F40/295;G06F40/30;G06F18/214;G06F18/2415;G06F18/25;G06N3/045;G06N3/0499;G06N3/0895;G06N5/045

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种生物医学领域文档级关系抽取方法及系统,属于自然语言处理的技术领域,通过引入一个信息交互模块来有效地获得上下文的提及表示并结合融合层生成关系类型分数,使模型可以更好的学习到生物实体之间丰富的信息;同时为了挖掘实体对之间隐含的信息,融合提及对的特征向量,将特征矩阵输入到推理模块,学习更具象的表示。此外还结合对比学习以鼓励长尾标签对整体损失做出更大的贡献,解决生物文献中正、负例分布不平衡的情况,进一步提高了模型抽取实体间关系的精度。

主权项:1.一种基于增强句法推理预训练模型的生物医学领域文档级关系抽取方法,其特征在于,所述方法包括:获取生物医学文本数据集,并对所述数据集中的数据进行预处理;构建生物医学领域文档级关系抽取模型,并利用所述关系抽取模型对预处理后的生物医学文本进行生物医学领域文档级关系抽取;其中,所述关系抽取模型包括:输入层、交互层、特征融合层、增强推理层和输出层;其中:所述输入层用于将预处理后的数据输入所述关系抽取模型;所述交互层将头部和尾部实体信息进行全面交互,以生成上下文表示;所述特征融合层为每个提及实体对分配特定权重并合,生成提及对的表示,并总结所有目标参考对的预测结果;所述增强推理层首先将提及实体对的特征向量拼接成特征矩阵,然后通过单线性层降维,再对所有推理多头自注意模块的输出相加,最后将每一个推理层重复操作,引入对比学习中的焦点损失和交叉熵损失计算损失值,由分类器生成每个关系类型的概率,得到关系分数;所述输出层输出所述增强推理层得到的关系分数。

全文数据:

权利要求:

百度查询: 大连海事大学 一种生物医学领域文档级关系抽取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。