申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
申请日:2023-10-13
公开(公告)日:2024-02-02
公开(公告)号:CN117094329B
主分类号:G06F40/44
分类号:G06F40/44;G06F40/242;G06F40/30;G06F40/211;G10L15/26;G10L15/18
优先权:
专利状态码:有效-授权
法律状态:2024.02.02#授权;2023.12.08#实质审查的生效;2023.11.21#公开
摘要:本发明公开了一种用于解决语音歧义的语音翻译方法及装置,涉及语音翻译技术领域。包括:获取待翻译的语音数据;构建同音异义词词典;将语音数据输入到构建好的语音翻译模型;根据语音数据、同音异义词词典以及语音翻译模型,得到语音数据的翻译文本。本发明构建了一种高效的语音消歧的方法,能够有效地缓解语音翻译模型中的歧义现象,提高语音翻译的准确度。
主权项:1.一种用于解决语音歧义的语音翻译方法,其特征在于,所述方法包括:S1、获取待翻译的语音数据;S2、构建同音异义词词典;S3、将所述语音数据输入到构建好的语音翻译模型;S4、根据所述语音数据、同音异义词词典以及语音翻译模型,得到语音数据的翻译文本;所述语音翻译模型包括语音编码器、翻译编码器和翻译解码器;所述S3中的语音翻译模型的构建过程,包括:S31、获取源语音序列样本,利用所述同音异义词词典对源语音序列样本中的歧义语音片断进行标注,得到标注后的源语音序列样本;S32、利用所述语音编码器对所述标注后的源语音序列样本进行压缩,得到隐藏状态的源语音序列样本;S33、利用所述翻译编码器对所述隐藏状态的源语音序列样本进行处理,得到第一语音编码特征;S34、对所述隐藏状态的源语音序列样本进行掩码操作,得到掩码后的语音序列样本,利用所述翻译编码器对所述掩码后的语音序列样本进行处理,得到第二语音编码特征;S35、根据所述第一语音编码特征以及第二语音编码特征,计算得到字符层面对比学习损失函数以及句子层面对比学习损失函数;S36、利用所述翻译解码器对所述隐藏状态的源语音序列样本进行处理,得到目标文本的第一概率分布;S37、利用所述翻译解码器对所述掩码后的语音序列样本进行处理,得到目标文本的第二概率分布;S38、根据所述第一概率分布以及第二概率分布,计算得到模型层面对比学习损失函数和语音翻译损失函数,进而得到总损失函数,根据所述总损失函数训练语音翻译模型,得到构建好的语音翻译模型。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种用于解决语音歧义的语音翻译方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。