买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于语音迁移学习的新闻播报个性化音频生成系统及方法_卓世未来(天津)科技有限公司_202410186876.3 

申请/专利权人:卓世未来(天津)科技有限公司

申请日:2024-02-20

公开(公告)日:2024-03-22

公开(公告)号:CN117743630A

主分类号:G06F16/635

分类号:G06F16/635;G06F16/335;G06F16/35;G06F16/65;G10L13/02

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.09#实质审查的生效;2024.03.22#公开

摘要:本发明提供一种基于语音迁移学习的新闻播报个性化音频生成系统及方法,属于语音合成技术领域。所述系统包括:数据采集模块,用于获取用户偏好新闻播报音频合集及播报新闻音频文本;特征提取模块,用于对获取的数据进行特征提取,得到音频声音特征信息及文本特征信息;第一确定模块,用于计算出个性化播报语音选择系数;第二确定模块,用于计算出个性化新闻文本内容选择系数;音频合成播报模块,用于根据个性化播报语音选择系数与个性化新闻文本内容选择系数确定用户个性化音频调控指数,为用户定制个性化新闻音频播报;用户界面,用于为用户提供偏好更改功能,满足用户个性化新闻播报需求。采用本发明,能够精准推荐用户个性化新闻播报音频。

主权项:1.一种基于语音迁移学习的新闻播报个性化音频生成系统,其特征在于,所述系统包括:数据采集模块,用于获取用户偏好新闻播报音频合集及播报新闻音频文本;特征提取模块,用于对获取的用户偏好新闻播报音频合集及播报新闻音频文本进行预处理及特征提取,得到音频声音特征信息及文本特征信息;第一确定模块,用于根据音频声音特征信息计算出个性化播报语音选择系数,其中,所述个性化播报语音选择系数用于选择用户喜好播报语音特征;第二确定模块,用于根据文本特征信息计算出个性化新闻文本内容选择系数,其中,所述个性化新闻文本内容选择系数用于选择用户个性化新闻内容;音频合成播报模块,用于根据个性化播报语音选择系数与个性化新闻文本内容选择系数确定用户个性化音频调控指数,通过用户个性化音频调控指数为用户定制个性化新闻音频播报;用户界面,用于为用户提供偏好更改功能,满足用户个性化新闻播报需求。

全文数据:

权利要求:

百度查询: 卓世未来(天津)科技有限公司 基于语音迁移学习的新闻播报个性化音频生成系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。