申请/专利权人:北京海纳数聚科技有限公司
申请日:2024-04-16
公开(公告)日:2024-05-17
公开(公告)号:CN118052291A
主分类号:G06N5/04
分类号:G06N5/04;G06N5/022;G06F17/15
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.06.04#实质审查的生效;2024.05.17#公开
摘要:本申请提供了一种基于扩张因果图嵌入的垂直领域大语言模型训练方法。本申请通过,获取目标垂直领域对应的垂直领域数据集,并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱;获取通用领域的生成式预训练转换器模型,并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层,得到对应的图嵌入模型;将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型,以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系,使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练,得到所述目标垂直领域对应的垂直领域模型。从而改善模型的输出效果。
主权项:1.一种基于扩张因果图嵌入的垂直领域大语言模型训练方法,其特征在于,所述方法包括:获取目标垂直领域对应的垂直领域数据集,并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱;获取通用领域的生成式预训练转换器模型,并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层,得到对应的图嵌入模型;将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型,以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系,使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练,得到所述目标垂直领域对应的垂直领域模型。
全文数据:
权利要求:
百度查询: 北京海纳数聚科技有限公司 一种基于扩张因果图嵌入的垂直领域大语言模型训练方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。