申请/专利权人:北京深维智讯科技有限公司
申请日:2023-03-17
公开(公告)日:2024-03-29
公开(公告)号:CN116484848B
主分类号:G06F40/279
分类号:G06F40/279;G06F40/30;G06V10/40;G06N3/006;G06N3/042;G06N3/044;G06N3/0442;G06N3/045;G06N3/048;G06N7/01
优先权:
专利状态码:有效-授权
法律状态:2024.03.29#授权;2023.08.11#实质审查的生效;2023.07.25#公开
摘要:本发明属于NLP技术领域,公开了一种基于NLP的文本实体识别方法,包括如下步骤:采集文本大数据,对文本大数据进行预处理,得到文本标准数据集;根据文本标准数据集,并基于NLP技术的预训练语言子模型、循环神经网络、图神经网络以及注意力机制,建立文本实体识别模型;获取待识别文本数据,将待识别文本数据输入文本实体识别模型进行文本实体识别,得到文本实体识别结果。本发明解决了现有技术存在的现有技术的特征提取不够全面、模型精度受限,实用性不强以及文本实体识别效果差的问题。
主权项:1.一种基于NLP的文本实体识别方法,其特征在于:包括如下步骤:采集文本大数据,对文本大数据进行预处理,得到文本标准数据集;根据文本标准数据集,并基于NLP技术的预训练语言子模型、循环神经网络、图神经网络以及注意力机制,建立文本实体识别模型;所述的文本实体识别模型包括输入层、语义特征提取模块、图特征提取模块、特征交互协作模块、CRF模块以及输出层,所述的输入层分别与语义特征提取模块和图特征提取模块连接,所述的语义特征提取模块和图特征提取模块均与特征交互协作模块连接,且语义特征提取模块基于BERT预训练语言子模型和BILSTM网络建立,所述的图特征提取模块与语义特征提取模块连接,且图特征提取模块基于BERT预训练语言子模型和GAT网络建立,所述的特征交互协作模块与CRF模块连接,且特征交互协作模块基于交互注意力机制建立,所述的CRF模块与输出层连接;获取待识别文本数据,将待识别文本数据输入文本实体识别模型进行文本实体识别,得到文本实体识别结果。
全文数据:
权利要求:
百度查询: 北京深维智讯科技有限公司 一种基于NLP的文本实体识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。