首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于多语义特征融合的人工智能领域实体识别方法及系统_浙江大学_202410142010.2 

申请/专利权人:浙江大学

申请日:2024-02-01

公开(公告)日:2024-05-17

公开(公告)号:CN117669574B

主分类号:G06F40/295

分类号:G06F40/295;G06F40/30;G06F40/126;G06N3/0442;G06N3/0455;G06N3/048;G06N3/0499;G06N3/08;G06N7/01

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种基于多语义特征融合的人工智能领域实体识别方法及系统,属于文本实体识别领域。本发明将编码器、双向长短期记忆网络层、注意力融合层和条件随机场层级联形成实体识别模型,通过对编码器中的BERT模型和注意力融合层中的注意力机制进行改进,再结合对条件随机场层中损失函数的优化,显著提高了在人工智能领域中实体识别和关系抽取的准确度,能够提升模型的稳定性和泛化能力。本发明可解决人工智能领域实体识别过程中存在的文本过长、内容复杂、实体与实体之间存在强关联关系等问题,准确实现人工智能领域长文本段落中的实体识别。

主权项:1.一种基于多语义特征融合的人工智能领域实体识别方法,其特征在于,包括:S1、将人工智能领域的待识别文本输入编码器中,由BERT模型对待识别文本进行分词后将词元序列转换为第一词向量序列,每个第一词向量依次通过多层Transformer编码层进行编码后将所有Transformer编码层输出的特征向量进行拼接,再将拼接向量通过第一全连接层进行降维处理,从而将第一词向量序列映射为第二词向量序列;S2、将第二词向量序列输入双向长短期记忆网络层中,对待识别文本中的上下文语义表征进行捕捉,得到第三词向量序列;S3、将第三词向量序列输入注意力融合层中,以前馈神经网络作为评分函数,计算第三词向量序列中第三词向量之间的语义关联度,并基于语义关联度向每个第三词向量中融入上下文语义信息,得到每个第三词向量对应的上下文向量;每个第三词向量与对应的上下文向量拼接后,通过非线性激活函数进行融合,融合向量通过第二全连接层进行降维处理,从而将第三词向量序列转换为语义增强的第四词向量序列;S4、将第四词向量序列输入条件随机场层中,输出待识别文本中每个词元对应的实体标签。

全文数据:

权利要求:

百度查询: 浙江大学 基于多语义特征融合的人工智能领域实体识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术