【发明公布】一种对音频文件进行审核的方法、装置和设备_上海哔哩哔哩科技有限公司_202311842568.3

申请/专利权人：上海哔哩哔哩科技有限公司

申请日：2023-12-28

公开（公告）日：2024-04-12

公开（公告）号：CN117877515A

主分类号：G10L25/30

分类号：G10L25/30;G06F18/2411;G06F18/214;G10L25/48

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本公开的各实施例的目的是提供一种对音频文件进行审核的方法、装置和设备。其中，所述音频审核模型包括编码部和解码部，所述编码部包括TDNN模型及傅里叶变换模型，所述解码部包括预训练的大语言模型；其中，使用音频样本对来训练所述TDNN模型的第一输出向量序列以及所述傅里叶变换模型的第二输出向量序列与所述预训练的大语言模型的输入向量序列之间的映射权重，其中，所述TDNN模型和所述预训练的大语言模型已预训练好并保持各自当前的模型参数不变；仍保持所述TDNN模型的当前模型参数不变，使用所述音频样本对来调整所述映射权重以及所述预训练的大语言模型的模型参数。本公开的各实施例可以用于多模态音频审核任务。

主权项：1.一种对音频审核模型进行训练的方法，其中，所述音频审核模型包括编码部和解码部，所述编码部包括TDNN模型及傅里叶变换模型，所述解码部包括预训练的大语言模型；其中，该方法包括以下步骤：使用音频样本对来训练所述TDNN模型的第一输出向量序列以及所述傅里叶变换模型的第二输出向量序列与所述预训练的大语言模型的输入向量序列之间的映射权重，其中，所述TDNN模型和所述预训练的大语言模型已预训练好并保持各自当前的模型参数不变；其中，一个所述音频样本对包括一个音频数据样本及其对应的结构化描述信息，所述结构化描述信息包括审核结果；保持所述TDNN模型的当前模型参数不变，使用所述音频样本对来调整所述映射权重以及所述预训练的大语言模型的模型参数。

全文数据：

权利要求：

百度查询：上海哔哩哔哩科技有限公司一种对音频文件进行审核的方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

下一篇：一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

相关技术

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种园林绿化便携铲_马丽丽_202322375183.2

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

龙图腾网&IPTOP

【发明公布】一种对音频文件进行审核的方法、装置和设备_上海哔哩哔哩科技有限公司_202311842568.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务