申请/专利权人:深圳芯瑞华声科技有限公司
申请日:2023-12-29
公开(公告)日:2024-04-05
公开(公告)号:CN117831537A
主分类号:G10L15/26
分类号:G10L15/26;G06F18/10;G06F18/213;G10L15/34;G10L21/0272;G06F123/02
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.23#实质审查的生效;2024.04.05#公开
摘要:本发明提供了一种基于多级忆阻器阵列的会议转写方法、系统及电子设备,设计语音转写技术领域;该方法包括以下步骤:在多人会议场景中采集语音数据,并按设定的第一规则对语音数据进行分割,得到音频片段;检测所述音频片段是否为多人音频;若所述音频片段为多人音频,则对所述多人音频进行分离,得到音频数据;将所有音频数据和单人音频按设定的第二规则分配至多级忆阻器阵列上,通过多级忆阻器阵列对音频数据进行语音转写,获取每个忆阻器阵列输出的语音转写结果;一个所述语音转写结果对应一个时间标签;根据所述时间标签对每一个所述语音转写结果进行排序,形成会议记录;本发明的有益效果是:能够提高语音转写的效率,并保证转写的准确率。
主权项:1.一种基于多级忆阻器阵列的会议转写方法,其特征在于,该方法包括以下步骤:在多人会议场景中采集语音数据,并按设定的第一规则对语音数据进行分割,得到音频片段;检测所述音频片段是否为多人音频;所述多人音频是指包含至少两个不同的说话人的人声数据的音频片段;若所述音频片段为多人音频,则对所述多人音频进行分离,使音频片段中存在不同人声的重叠部分实现音频分离,得到音频数据;将所有音频数据和单人音频按设定的第二规则分配至多级忆阻器阵列上,通过多级忆阻器阵列对音频数据进行语音转写,获取每个忆阻器阵列输出的语音转写结果;一个所述语音转写结果对应一个时间标签;所述单人音频是指仅包含一个说话人的人声数据的音频片段;根据所述时间标签对每一个所述语音转写结果进行排序,形成会议记录。
全文数据:
权利要求:
百度查询: 深圳芯瑞华声科技有限公司 基于多级忆阻器阵列的会议转写方法、系统及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。