申请/专利权人:科大讯飞股份有限公司
申请日:2023-12-06
公开(公告)日:2024-04-19
公开(公告)号:CN117909459A
主分类号:G06F16/332
分类号:G06F16/332;G06F18/213;G06F18/22;G06N3/045;G06N3/096
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.07#实质审查的生效;2024.04.19#公开
摘要:本申请公开了一种问题回答方法及相关装置、设备和存储介质,其中,问题回答方法包括:将待回答问题的问题特征输入至在问题回答任务上经参数微调的大语言模型;其中,参数微调时冻结大语言模型的网络参数;获取大语言模型中目标网络层的输出特征,并获取大语言模型在参数微调时为目标网络层确定的特征迁移参数;基于目标网络层的输出特征和特征迁移参数,得到目标网络层的输出特征迁移至问题回答任务之后的迁移特征;其中,迁移特征用于供大语言模型中目标网络层之后的网络层继续处理,直至大语言模型中输出层;获取由输出层所输出的问题回答。上述方案,能够提升大语言模型的问题回答精度。
主权项:1.一种问题回答方法,其特征在于,包括:将待回答问题的问题特征输入至在问题回答任务上经参数微调的大语言模型;其中,所述参数微调时冻结所述大语言模型的网络参数;获取所述大语言模型中目标网络层的输出特征,并获取所述大语言模型在所述参数微调时为所述目标网络层确定的特征迁移参数;其中,所述特征迁移参数用于迁移所述大语言模型的特征分布适应于所述问题回答任务,且所述特征迁移参数包括:缩放参数、偏置参数和表征不同聚类中心的若干聚类特征中至少一者;基于所述目标网络层的输出特征和特征迁移参数,得到所述目标网络层的输出特征迁移至所述问题回答任务之后的迁移特征;其中,所述迁移特征用于供所述大语言模型中所述目标网络层之后的网络层继续处理,直至所述大语言模型中输出层;获取由所述输出层所输出的问题回答。
全文数据:
权利要求:
百度查询: 科大讯飞股份有限公司 问题回答方法及相关装置、设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。