首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】音频标注处理装置_闽江学院;福州市长乐区极微信息科技有限公司_202110337053.2 

申请/专利权人:闽江学院;福州市长乐区极微信息科技有限公司

申请日:2021-03-30

公开(公告)日:2024-04-30

公开(公告)号:CN113053393B

主分类号:G10L15/26

分类号:G10L15/26;G10L15/04;G10L15/28

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2023.12.29#专利申请权的转移;2021.07.16#实质审查的生效;2021.06.29#公开

摘要:本发明提供一种音频标注处理装置,用于解决人工智能语音数据标注工作中的隐私保护问题。

主权项:1.一种音频标注处理装置,其特征在于,包括切分单元UnitS、处理单元UnitP和合成单元UnitC,其中切分单元具体包括:待标注音频文件获取单元,用于获取N个待标注音频文件F1,F2,F3...Fn,待标注音频文件切分单元,用于将每个待标注音频文件切分成多个音频片段,乱序处理单元,用于将所有待标注音频文件切分形成的音频片段乱序处理,生成乱序处理后的音频片段集合As,生成的音频片段集合As被配置为,每两个相邻的音频片段以大于或等于P1的概率不属于同一个待标注音频文件,以大于或等于P2的概率不是同一个待标注音频文件的相邻两个切分;切分记录单元,记录所有待标注音频文件的切分点位置,以及所述切分点位置与所述切分位置对应的所述音频片段集合As中的元素的对应关系,形成切分记录Rs;其中处理单元UnitP具体包括:音频片段获取单元,用于获取乱序处理后的音频片段集合As,标注处理单元,用于根据对乱序后的音频片段进行标注处理的结果,形成标注记录Ls;其中合成单元UnitC具体包括:标注记录获取单元,用于获取标注记录Ls,切分记录获取单元,用于获取切分记录Rs,标注记录重组单元,用于利用Rs将Ls中的标注内容重组排列,使得重组后的标注内容的顺序与所述待标注音频文件的内容一致,形成重组标注记录RLs;所述切分记录Rs对所述处理单元UnitP隔离;具体为,处理单元UnitP中的子单元和或涉及的装置,被设置为不获取所述切分记录Rs的内容或被设置为获得切分记录Rs的加密形式,但不获取解密的所述切分记录Rs的加密形式的密钥信息或被设置为不获取所述切分记录Rs的内容,但获取由Rs通过不可逆推原始内容的操作处理后获得指纹信息;所述切分单元UnitS还包括如下单元:随机重命名单元,用于将音频片段集合As的音频文件随机重命名,记录重命名后的文件和原文件的对应关系,文件名排序单元,用于将音频片段集合As的音频文件以文件名字母顺序排序校验重排单元,用于执行校验重排操作:获取两个相邻的音频片段属于同一个待标注音频文件的音频片段集合S1,获取两个相邻的音频片段是同一个待标注音频文件的相邻两个切分的音频片段集合S2,如果NS1NAs1-P1,则将属于S1的音频片段文件再次随机重命名,如果NS2NAs1-P2,则将属于S2的音频片段文件再次随机重命名,其中N·表示音频片段集合·中的音频文件总数,执行所述校验重排操作多次,直到满足条件“每两个相邻的音频片段以大于或等于P1的概率不属于同一个待标注音频文件,以大于或等于P2的概率不是同一个待标注音频文件的相邻两个切分”为止;随机微调单元,用于对所述音频片段集合As中的每个音频片段的时长进行随机微调;时间修改单元,用于对所述音频片段集合As中的每个音频片段的文件创建修改时间进行修改混淆。

全文数据:

权利要求:

百度查询: 闽江学院;福州市长乐区极微信息科技有限公司 音频标注处理装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术