北京百度网讯科技有限公司董晓飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利用于移动终端的字幕生成方法、装置、设备以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112653932B 。
龙图腾网通过国家知识产权局官网在2023-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011497650.3,技术领域涉及:H04N21/488;该发明授权用于移动终端的字幕生成方法、装置、设备以及存储介质是由董晓飞设计研发完成,并于2020-12-17向国家知识产权局提交的专利申请。
本用于移动终端的字幕生成方法、装置、设备以及存储介质在说明书摘要公布了:本公开公开了用于移动终端的字幕生成方法、装置、设备以及存储介质,涉及人工智能领域,尤其涉及语音识别、自然语言处理技术领域,具体实现方案为:获取基于音频数据采集设备采集的输入语音;采用语音识别模型,将输入语音转换为输入文字;获取配置于输入视频的时间轴;将输入文字添加至用户选择的输入视频的时间轴片段,提供了一种在移动终端为视频添加字幕的方法,相较于在个人计算机端使用专业软件工具为视频添加字幕,节省了学习成本,简化了字幕添加流程。
本发明授权用于移动终端的字幕生成方法、装置、设备以及存储介质在权利要求书中公布了:1.一种用于移动终端的字幕生成方法,包括:获取基于音频数据采集设备采集的输入语音,其中,所述输入语音包括用户基于预设的操作方式对所述输入语音的至少一个时间节点所做的断点标识,其中,所述预设的操作方式是指对所述输入语音的任意时间节点进行断点操作的行为方式,断点是对所述输入语音的某个时间点打标签,所述断点操作不会导致所述输入语音停止,所述断点标识包括开始标识和结束标识;采用语音识别模型,将所述输入语音转换为输入文字;获取配置于输入视频的时间轴,其中,所述时间轴用于按照时间的先后顺序对视频帧进行串联,得到所述输入视频;将所述输入文字添加至用户选择的所述输入视频的时间轴片段;其中,所述采用语音识别模型,将所述输入语音转换为输入文字还包括:基于所述断点标识,对所述输入语音进行截取,得到多段语音;对所述多段语音进行识别,得到多段字幕文本;其中,所述获取基于音频数据采集设备采集的输入语音,包括:响应于用户开启语音字幕功能,开启移动终端麦克风功能并采集用户语音输入的字幕内容;其中,所述将所述输入文字添加至用户选择的所述输入视频的时间轴片段,包括:将所述时间轴片段的开始时间作为所述输入文字的开始显示时间;将所述时间轴片段的结束时间作为所述输入文字的结束显示时间。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。