申请/专利权人:河南工业大学
申请日:2023-12-22
公开(公告)日:2024-05-07
公开(公告)号:CN117993387A
主分类号:G06F40/295
分类号:G06F40/295;G06F40/30;G06N3/045;G06N3/096
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.24#实质审查的生效;2024.05.07#公开
摘要:本发明提出一种基于大语言模型的煤化工领域中文命名实体识别方法,首先,通过预定义特定的关系类型,将实体类型信息与每个关系类型相关联,以提高大语言模型LargeLanguageModel,LLMe.g.GPT‑3.5对实体‑关系的语义理解和实体在文本中的相关性。其次,根据特定任务的提示指令,使大语言模型生成与预定义的关系类型相似的关系列表。然后,将关系列表和特定任务模板的提示指令作为大语言模型的输入,使用实体‑关系的语义信息确定文本中存在的实体并进行识别。最后,采用可信性和一致性度量标准加权评估实体槽,并剔除错误实体。有效地抽取出具有复杂情况的煤化工领域相关实体,包括多个实体共享同一实体以及同一对实体之间存在多个关系的情况。
主权项:1.一种基于大语言模型的煤化工领域中文命名实体识别方法,其特征在于:所述方法步骤如下:步骤S1提示大语言模型生成关系列表;步骤S2结合生成的关系列表,采用关系驱动的方式进行实体识别;步骤S3运用PageRank算法对实体进行可信度评估;步骤S4基于BERT的语义相似性计算评估生成的实体信息与文本之间的一致性;步骤S5将可信性和一致性结果进行加权处理,以筛选和验证实体;步骤S6评价模型训练的结果。
全文数据:
权利要求:
百度查询: 河南工业大学 一种基于大语言模型的煤化工领域命名实体识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。