申请/专利权人:谷歌有限责任公司
申请日:2018-02-26
公开(公告)日:2023-12-08
公开(公告)号:CN117201889A
主分类号:H04N21/488
分类号:H04N21/488;H04N21/2343;H04N21/235
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.12.26#实质审查的生效;2023.12.08#公开
摘要:本申请公开了预先录制的视频的自动语音翻译配音,提供了一种将原始字幕数据的翻译与视频的音频部分对齐的方法。该方法包括由处理设备识别包括多个字幕字符串的视频的原始字幕数据。处理设备识别话语辨识数据,该话语辨识数据包括多个生成字符串以及每个生成字符串的相关联的定时信息。处理设备使用指示字符串之间的语义相似性的指配值将多个字幕字符串映射到多个生成字符串。处理设备基于映射的单独生成字符串的定时信息来将定时信息指配给单独字幕字符串。处理设备使用单独字幕字符串的指配的定时信息将原始字幕数据的翻译与视频的音频部分对齐。
主权项:1.一种方法,包括:由处理设备识别具有包括以原始语言记录的话语的音频的视频的原始字幕数据,其中,所述原始字幕数据包括以所述原始语言的并且与所述视频的音频部分相关联的多个字幕字符串;由所述处理设备识别所述视频的翻译语言字幕数据,其中,所述翻译语言字幕数据包括与所述视频的所述音频部分相关联的多个翻译字符串;由所述处理设备从所述多个字幕字符串生成字幕语句片段集合,并且从所述多个翻译字符串生成翻译语句片段集合;由所述处理设备基于与所述原始字幕数据和所述翻译语言字幕数据相关联的定时,将所述字幕语句片段集合中的字幕语句片段映射到所述翻译语句片段集合中对应的翻译语句片段;由所述处理设备使用与单独字幕字符串相对应的定时信息来估计所述字幕语句片段集合中的单独字幕语句片段的时间间隔;由所述处理设备基于所述单独字幕语句片段的估计时间间隔,向所述翻译语句片段集合中的单独翻译语句片段指配时间间隔;由所述处理设备利用所述翻译语句片段集合中的连续翻译语句片段生成翻译语句集合;以及由所述处理设备使用来自对应翻译语句的单独翻译语句片段的指配的时间间隔来将所述翻译语句集合与所述视频的所述音频部分对齐。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 预先录制的视频的自动语音翻译配音
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。