买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】语音翻译方法、系统、装置、终端及存储介质_北京小米移动软件有限公司;北京小米松果电子有限公司_202211199610.X 

申请/专利权人:北京小米移动软件有限公司;北京小米松果电子有限公司

申请日:2022-09-29

公开(公告)日:2024-04-05

公开(公告)号:CN117831535A

主分类号:G10L15/26

分类号:G10L15/26;G06F40/58;G10L19/00;G10L25/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本公开是关于一种语音翻译方法、系统、装置、终端及存储介质。该语音翻译方法包括:基于M组训练样本训练初始翻译系统,得到训练后的翻译系统,M为N+1,N为大于1的正整数;将语音信号中的第一语音片段输入至语音编码器,得到语音编码器输出的第一语音片段对应的语音状态序列,语音信号包括多个语音片段,且语音信号属于源语言;将第一语音片段对应的语音状态序列以及N个参考数据输入至文本解码器,分别得到文本解码器输出的第一语音片段对应的、N种目标语言的目标文本片段。该方法提供的翻译系统实现了将一种源语言的语音信号翻译为多种目标语言的文本。

主权项:1.一种语音翻译系统,其特征在于,所述语音翻译系统包括语音编码器和文本解码器,所述语音编码器包括依次连接的卷积神经网络、注意力网络和前馈神经网络;所述文本解码器包括依次连接的N个词嵌入层、解码网络和N个输出层,所述解码网络包括自注意力层、目标源注意力层和前馈神经网络,所述语音编码器的输出端与所述解码网络中的目标源注意力层的输入端连接,每个词嵌入层的输入端输入一种目标语言对应的参考数据,所述N个输出层与所述N个词嵌入层一一对应,每个输出层的输出一种目标语言的文本,所述N为大于1的正整数;所述语音编码器用于对输入的语音信号进行编码,得到语音状态序列,所述文本解码器用于基于输入的N个参考数据,对所述语音编码器输出的语音状态序列进行解码,得到N种目标语言的文本。

全文数据:

权利要求:

百度查询: 北京小米移动软件有限公司;北京小米松果电子有限公司 语音翻译方法、系统、装置、终端及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。