【发明授权】智能人机对话模型训练方法、模型训练装置及电子设备_深圳市优必选科技股份有限公司_202010187709.2

申请/专利权人：深圳市优必选科技股份有限公司

申请日：2020-03-17

公开（公告）日：2023-05-26

公开（公告）号：CN111460115B

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06N3/045;G06N3/0442;G06N3/0455;G06N3/047;G06N3/048;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2023.05.26#授权;2020.08.21#实质审查的生效;2020.07.28#公开

摘要：本申请提供了一种智能人机对话模型训练方法、装置、电子设备及计算机可读存储介质，该方法包括：获取当前轮次的用户语句及前一轮次的系统语句，拼接并输入至BERT模型中，得到当前对话矩阵；将当前对话矩阵输入至待训练的第一双向GRU模型中，得到会话语义向量；对会话语义向量进行第一线性变换得到意图向量，并对会话语义向量进行第二线性变换得到对话行为向量；根据意图向量计算得到意图损失，并根据对话行为向量计算得到对话行为损失；基于意图损失及对话行为损失进行反向传播，对各个待训练的模型的模型参数进行更新。本申请方案融合了BERT模型及GRU模型来编码历史记忆，并在语义解析时融合了前一轮的系统语句，可以得到准确度更高的语义解析模型。

主权项：1.一种智能人机对话模型训练方法，其特征在于，包括：获取当前轮次的用户语句及前一轮次的系统语句；将所述用户语句及所述系统语句拼接并输入至BERT模型中，得到当前对话矩阵；将所述当前对话矩阵输入至待训练的第一双向GRU模型中，得到会话语义向量，其中，所述会话语义向量基于所述第一双向GRU模型在第一方向上的第一输出结果及第二方向上的第二输出结果拼接而得，所述第一双向GRU模型的初始隐藏层基于其它语句而构建，所述其它语句为除所述系统语句之外的历史轮次的语句；对所述会话语义向量进行第一线性变换得到意图向量，并对所述会话语义向量进行第二线性变换得到对话行为向量；根据所述意图向量计算得到意图损失，并根据所述对话行为向量计算得到对话行为损失；基于所述意图损失及所述对话行为损失进行反向传播，对各个待训练的模型的模型参数进行更新；其中，所述将所述当前对话矩阵输入至待训练的第一双向GRU模型中，得到会话语义向量，包括：在将所述当前对话矩阵输入至所述第一双向GRU模型之后，将所述第一双向GRU模型在所述第一方向上的最末隐藏层的输出作为第一输出结果；将所述第一双向GRU模型在所述第二方向上的最末隐藏层的输出作为第二输出结果；对所述第一输出结果及所述第二输出结果进行拼接，得到所述会话语义向量；其中，所述对所述会话语义向量进行第一线性变换得到意图向量，包括：根据预设的第一参数矩阵对所述会话语义向量进行线性变换，得到第一中间向量，其中，所述第一参数矩阵的矩阵行数根据所述会话语义向量的维度而确定，所述第一参数矩阵的矩阵列数根据预设的意图类别的总数而确定，所述第一中间向量的维度为所述意图类别的总数；基于预设的第一激活函数对所述第一中间向量进行变换，得到意图向量，其中，所述意图向量中的各个维度用于表示所述用户语句属于各个意图类别的概率；其中，所述对所述会话语义向量进行第二线性变换得到对话行为向量，包括：根据预设的第二参数矩阵对所述会话语义向量进行线性变换，得到第二中间向量，其中，所述第二参数矩阵的矩阵行数根据所述会话语义向量的维度而确定，所述第二参数矩阵的矩阵列数根据预设的对话行为类别的总数而确定，所述第二中间向量的维度为所述对话行为类别的总数；基于预设的第二激活函数对所述第二中间向量进行变换，得到对话行为向量，其中，所述意图向量中的各个维度用于表示所述用户语句命中各个对话行为类别的得分。

全文数据：

权利要求：

百度查询：深圳市优必选科技股份有限公司智能人机对话模型训练方法、模型训练装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种热式流量传感器及其封装方法_希尔思仪表(深圳)有限公司_202410157751.8

下一篇：一种航空油料斗回收检査装置_中国航空油料有限责任公司内蒙古分公司_202420470652.0

相关技术

一种热式流量传感器及其封装方法_希尔思仪表(深圳)有限公司_202410157751.8

一种航空油料斗回收检査装置_中国航空油料有限责任公司内蒙古分公司_202420470652.0

一种多节点数据集中采集处理的无人化监控系统_天津新松智能科技有限公司_202322415387.4

集成排烟系统的排烟方法、装置、电子装置和存储介质_宁波方太厨具有限公司_202410026105.8

一种环绕山体布置的光伏阵列柔性支架_中鼎建投(北京)集团有限公司_202322357469.8

一种六堡茶发醇冷水加湿设备_广西联香集茶叶有限公司_202322501493.4

一种具有双重防拆防伪的标签_青岛金马防伪特种印刷有限公司_202322542758.5

一种抗爆百叶窗及双向抗爆防雨百叶窗_上海震业环境科技有限公司_202322355181.7

一种B型管切断装置_南方英特空调有限公司_202322397954.8

一种基于检测结果分料的正温系数器件检测工装_上海复通宝电子科技有限公司_202322352489.6

一种放沉淀活门_中国航空工业集团公司沈阳飞机设计研究所_202322587019.8

一种汽车前舱、前端模块及前副车架布置结构_东南(福建)汽车工业股份有限公司_202410164798.7

模型相关技术

模型训练方法和模型训练系统_丰田自动车株式会社_202311261877.1

模型构建方法、模型构建装置、设备以及存储介质_深圳市商汤科技有限公司_202410052345.5

模型编排器_谷歌有限责任公司_202280018038.4

一种三维管道模型转换为MapGIS模型的系统和方法_上海核工程研究设计院股份有限公司_202011009688.1

一种任务流调度模型和方法及模型构建方法和装置_阿米华晟数据科技(江苏)有限公司_202311818051.0

一种基于Stacking回归模型的气温预报模型、方法及介质_贵阳市白云区气象局_202410137568.1

一种基于视觉模型的大语言模型视频时序定位方法及产品_清华大学_202311763608.5

基于教育对象的理论模型和量化模型的分类方法及系统_五石炼成(上海)信息科技有限公司_202310726868.9

一种模型训练方法及模型训练装置_深圳追一科技有限公司_202110496339.5

悬架模型的构建方法和装置_奇瑞汽车股份有限公司_202410087230.X

方法相关技术

工艺方法_北京北方华创微电子装备有限公司_202211212212.7

加密方法_沃尔夫冈·弗拉托_202280053620.4

清洗方法_富泰华工业(深圳)有限公司_202410069555.5

检查设备、检查方法和制造方法_ASML荷兰有限公司_202110120313.0

密钥生成方法、签名的生成方法、签名的验证方法和装置_中国建设银行股份有限公司_202410002859.X

测量参数集的确定方法及装置、验证方法及故障诊断方法_中国核电工程有限公司_202110244931.6

样本流场数据生成方法、模型训练方法、流场重建方法_北京百度网讯科技有限公司_202311755670.X

基于深度学习方法和传统方法结合的火灾检测方法_东北林业大学_202410009061.8

身份识别模型训练方法、测试方法、识别方法及装置_北京中科虹霸科技有限公司_202010883587.0

会话建立方法、中继设备的选择方法和注册方法及设备_华为技术有限公司_202410063202.4

训练相关技术

模型训练方法和模型训练系统_丰田自动车株式会社_202311261877.1

龙船训练装置_谭进华_202322029115.0

一种训练装置_沭阳县中医院股份有限公司_202322396140.2

一种上肢康复训练装置及上肢康复训练方法_希迪克(郑州)智能康复设备有限公司_202311622241.5

一种具有综合康复训练策略的预适应训练系统_重庆邮电大学_202111521057.2

一种生成训练样本、训练代码分类模型的方法及装置_北京天融信网络安全技术有限公司_202311218705.6

网络训练及测试方法以及网络训练及测试模组_深圳市大富网络技术有限公司_202311854381.5

一种模型训练方法及模型训练装置_深圳追一科技有限公司_202110496339.5

一种可抗阻训练的髋关节康复训练器_衢州市中医医院_202322378676.1

一种用于专注力训练的训练策略调整方法及装置_深圳市心流科技有限公司_202311371742.0

龙图腾网&IPTOP

【发明授权】智能人机对话模型训练方法、模型训练装置及电子设备_深圳市优必选科技股份有限公司_202010187709.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务