买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于目标生成式回应语言模型的回应方法和装置_之江实验室_202310486966.X 

申请/专利权人:之江实验室

申请日:2023-05-04

公开(公告)日:2023-08-01

公开(公告)号:CN116303974B

主分类号:G06F16/332

分类号:G06F16/332;G06F40/35;G06F18/214;G06N20/20

优先权:

专利状态码:有效-授权

法律状态:2023.08.01#授权;2023.07.11#实质审查的生效;2023.06.23#公开

摘要:本申请涉及一种基于目标生成式回应语言模型的回应方法和装置。其中,该方法包括:基于教育设备中的提示数据集,训练得到初始生成式提示语言模型和初始生成式回应语言模型;并利用评分模型对二者的预测结果进行评分;基于对评分值的加权计算结果,通过强化学习和对抗学习进一步训练初始生成式提示语言模型和初始生成式回应语言模型,得到目标生成式回应语言模型;将教育设备采集的待测文本数据输入目标生成式回应语言模型,目标生成式回应语言模型将待测文本数据与对话数据进行拼接,得到相应的回应。采用本方法能生成多样的新提示,并加强生成式提示语言模型和生成式回应语言模型之间的交互,从而进一步改善生成式语言模型的意料外行为问题。

主权项:1.一种基于目标生成式回应语言模型的回应方法,其特征在于,所述方法包括:基于教育设备中的提示数据集,训练得到初始生成式提示语言模型和初始生成式回应语言模型;所述初始生成式提示语言模型具备根据提示生成新提示的能力,所述初始生成式回应语言模型具备根据提示生成回应的能力;基于采样所述教育设备中成对的提示数据,训练得到提示评分模型;基于采样所述教育设备中成对的回应数据,训练得到回应评分模型;利用所述提示评分模型对所述初始生成式提示语言模型输出的预测提示进行评分,得到提示评分值;利用所述回应评分模型对所述初始生成式回应语言模型输出的预测回应进行评分,得到回应评分值;对所述提示评分值和所述回应评分值进行加权计算,基于加权计算结果,通过强化学习和对抗学习进一步训练所述初始生成式提示语言模型和所述初始生成式回应语言模型,得到目标生成式回应语言模型;将所述教育设备采集的待测文本数据输入所述目标生成式回应语言模型,所述目标生成式回应语言模型将待测文本数据与对话数据进行拼接,得到相应的回应。

全文数据:

权利要求:

百度查询: 之江实验室 基于目标生成式回应语言模型的回应方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。