【发明授权】基于常识推理的语音合成模型训练方法、装置及合成方法_北京邮电大学_202311071256.7

导航：龙图腾网> 最新专利技术> 基于常识推理的语音合成模型训练方法、装置及合成方法_北京邮电大学_202311071256.7

申请/专利权人：北京邮电大学

申请日：2023-08-24

公开（公告）日：2024-03-19

公开（公告）号：CN117238275B

主分类号：G10L13/08

分类号：G10L13/08;G10L25/24;G10L25/63

优先权：

专利状态码：有效-授权

法律状态：2024.03.19#授权;2024.01.02#实质审查的生效;2023.12.15#公开

摘要：本申请提供一种基于常识推理的语音合成模型训练方法、装置及合成方法，所述训练方法包括：从数据集中确定目标对话语音对应的目标对话文本以及目标对话人标识以及多个历史对话文本、历史语音以及历史对话人标识；基于目标对话文本和目标对话人标识得到目标对话文本向量；并基于各个历史对话文本、历史语音、历史对话人标识，以及目标对话文本、预先获取的常识推理训练模型和预设的多模态上下文关联模块得到情感状态嵌入向量；基于目标对话文本向量和情感状态嵌入向量得到目标对话文本合成语音；基于上述内容进行模型训练得到对话语音合成模型。本申请能够有效提高模拟语音的真实性，进而提高用户在如人机对话等具体应用场景的用户体验。

主权项：1.一种基于常识推理的语音合成模型训练方法，其特征在于，包括：从数据集中确定目标对话语音对应的目标对话文本以及该目标对话文本的目标对话人标识；并从所述数据集中选取在所述目标对话文本之前的多个历史语音、多个历史对话人标识以及各个所述历史语音各自对应的历史对话文本；基于所述目标对话文本和目标对话人标识得到目标对话文本向量；并基于各个所述历史对话文本、历史语音、历史对话人标识，以及所述目标对话文本、预先获取的常识推理训练模型和预设的多模态上下文关联模块得到情感状态嵌入向量；基于所述目标对话文本向量和情感状态嵌入向量得到目标对话文本合成语音；基于所述目标对话文本、目标对话人标识、各个历史对话文本、各个历史语音、各个历史对话人标识和目标对话文本合成语音对预设的语音生成器进行训练，并在训练过程中，基于所述目标对话语音确定所述目标对话文本合成语音的损失，并基于该损失迭代训练所述语音生成器，以得到用于将对话文本转换为对话语音的对话语音合成模型；其中，所述基于各个所述历史对话文本、历史语音、历史对话人标识，以及所述目标对话文本和预设的多模态上下文关联模块得到情感状态嵌入向量，包括：将各个所述历史对话文本和所述目标对话文本输入预先获取的文本训练模型中以输出得到各个所述历史对话文本各自对应的历史对话文本向量和所述目标对话文本对应的当前目标对话文本向量；将各个所述历史对话文本和所述目标对话文本输入所述常识推理训练模型中以输出得到各个所述历史对话文本各自对应的历史常识向量和所述目标对话文本对应的目标常识向量；将各个所述历史语音输入预先获取的语音训练模型中以输出得到各自对应的历史语音向量；将各个所述历史对话文本向量、历史常识向量、历史语音向量和历史对话人标识，以及所述目标常识向量和当前目标对话文本向量输入所述多模态上下文关联模块，以输出得到所述情感状态嵌入向量。

全文数据：

权利要求：

百度查询：北京邮电大学基于常识推理的语音合成模型训练方法、装置及合成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种园林绿化便携铲_马丽丽_202322375183.2

下一篇：一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

相关技术

一种园林绿化便携铲_马丽丽_202322375183.2

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

交通工具用座椅倾斜装置_丰田纺织株式会社_202080082271.X

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

再生废液处理系统_山东荣信集团有限公司_202322260404.1

训练相关技术

警务政策多功能训练装置_南京软明信息科技有限公司_202322181392.3

一种足球训练辅助装置_山西铁道职业技术学院_202420196121.7

用于胸腔穿刺训练的服装_中日友好医院(中日友好临床医学研究所)_202322044819.5

一种训练足球反弹率测量装置_天水师范学院_202410145976.1

一种步态康复训练机器人_苏州大学_201811359142.1

一种腿部恢复护理训练装置_鄂俊_202321448389.7

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种骨关节运动康复训练装置_山东大学齐鲁医院_202322393150.0

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

利用模型增强的自监督学习_硕动力公司_202280060208.5

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

通信方法及装置_华为技术有限公司_202010617172.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

信息处理方法_丰田自动车株式会社_202311358127.6

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

龙图腾网&IPTOP

【发明授权】基于常识推理的语音合成模型训练方法、装置及合成方法_北京邮电大学_202311071256.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务