买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向古籍的命名实体识别方法_北京信息科技大学_202311839688.8 

申请/专利权人:北京信息科技大学

申请日:2023-12-28

公开(公告)日:2024-03-29

公开(公告)号:CN117787281A

主分类号:G06F40/295

分类号:G06F40/295;G06N3/049;G06N3/0464;G06N3/08;G06N3/045;G06N3/0475;G06N3/094;G06F40/30;G06F16/35

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开了一种面向古籍的命名实体识别方法,涉及古籍命名实体识别技术领域,该方法针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型ANER‑IPAL。基于自建的古籍文本数据集,使用NEZHA‑TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,最后结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集GuNER2023上的F1值达到了95.34%,相较于基线模型NEZHA‑GP提高了4.19%。

主权项:1.一种面向古籍的命名实体识别方法,其特征在于,包括以下步骤:步骤一:建立一个古籍文本数据集;步骤二:使用快速梯度法在模型训练过程中添加干扰;步骤三:结合相应的规则进行结果的矫正输出,在模型的预测中,模型解码层引入的全局指针会无差别地识别嵌套实体和非嵌套实体,而在真实数据中没有嵌套实体的出现;因此,在数据输出处理时,将所有实体按照实体初始位置进行升序排序,按照实体结束位置进行降序排序,去除后续嵌套的实体。

全文数据:

权利要求:

百度查询: 北京信息科技大学 一种面向古籍的命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。