申请/专利权人:北京工业大学
申请日:2021-02-14
公开(公告)日:2021-06-08
公开(公告)号:CN112926325A
主分类号:G06F40/295(20200101)
分类号:G06F40/295(20200101);G06F40/30(20200101);G06N3/04(20060101)
优先权:
专利状态码:在审-实质审查的生效
法律状态:2021.06.25#实质审查的生效;2021.06.08#公开
摘要:本发明涉及一种基于BERT神经网络的中文人物关系抽取方法,用于解决非结构化的中文文本内人物关系难以抽取的技术问题,具体内容包括数据收集模块,对训练数据的获取、清洗、标注;特征获取与关系抽取模块,包括对句子上下文编码、命名实体识别、实体关系的预测;关系存储模块和应用服务模块,利用图数据库存储文本人物关系抽取出的人物实体关系图谱,基于SOA设计核心业务服务API接口,提供数据交互服务,Docker容器封装系统应用,使系统平台具有高可移植性和可扩展性,最终提供文本人物关系知识图谱功能。本发明能够有效地解决目前所面临的人物关系抽取召回率低、关系不准等问题。以达到更好的关系抽取平台服务。
主权项:1.一种基于BERT神经网络的中文人物关系抽取系统,其特征在于,包括:数据收集模块,对训练数据的获取、数据清洗、数据的标注,使用收集到的数据作为训练数据,获得各句子中存在的人物实体标签以及人物实体标签间的关系标签;特征获取与关系抽取模块,包括对每个句子进行上下文编码、对每个句子的上下文语义表征进行命名实体识别、综合其上下文语义表征和命名实体识别结果以及关系标签嵌入表示,预测每个句子中所有的实体关系;关系存储模块和应用服务模块,利用图数据库存储文本人物关系抽取出的人物实体关系图谱,基于SOA设计核心业务服务API接口,提供数据交互服务,Docker容器封装系统应用,最终提供文本人物关系知识图谱功能。
全文数据:
权利要求:
百度查询: 北京工业大学 基于BERT神经网络的中文人物关系抽取构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。