买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于语谱图的声音识别的可解释评价方法_南京航空航天大学_202410077267.4 

申请/专利权人:南京航空航天大学

申请日:2024-01-18

公开(公告)日:2024-04-26

公开(公告)号:CN117935777A

主分类号:G10L15/01

分类号:G10L15/01;G10L15/16;G10L15/02

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明提出了一种基于语谱图的声音识别的可解释性评价方法AI‑SCORE,属于声音识别和人工智能可解释领域;该方法将模型的解释结果作为输入,通过经过特征处理、二次预测以及相关计算工作,产生正负两方面有效性的评分指标,最终将这些指标综合为一个全面的解释评分,以评估模型的可解释性;本发明旨在于评估声音识别中不同特征提取方法和神经网络的解释效果,以帮助决策者更准确地选择最合适的特征提取方法和网络模型,从而加强用户对于声音识别系统的信任度。

主权项:1.一种基于语谱图的声音识别的可解释评价方法,分为音频预处理与特征提取、模型训练、模型解释、模型评价四部分,其特征在于:音频预处理与特征提取包含以下三个步骤:1用户预先提供音频数据集,对所有音频进行重采样,确保其具有相同的采样率。2保留数据集种时长为2.5秒以上的音频,并从每个音频中随机裁剪一段连续的时长为2.5秒的片段,作为待提取的样本。3将所有样本使用统一的特征提取方法转化为语谱图X。其中训练集表示为Xtrain,测试集表示为Xtest。数据集中的样本表示为x=x1,x2,...,xn,其中xi表示位置为i的像素集。模型训练包含以下一个步骤:4对语谱图数据集,使用深度神经网络进行训练,得到模型f。模型解释包含以下一个步骤:5对训练得到的模型f,应用Shap方法对测试集Xtest上的所有样本进行解释,得到每个样本x中所有像素集对应于不同标签的特征贡献度其中i对应于像素集在样本x的位置,y对应于标签。模型评价包含以下三个步骤:6对测试集Xtest中所有样本的像素集进行特征贡献度划分,得到对应的正特征集X+和负特征集X-。7将X+带入模型f进行预测,计算得到模型的正相关有效性的得分Score+。8将X-带入模型f进行预测,计算得到模型的负相关有效性的得分Score-。9对Score+与Score-加权得到最终评分Score:Score=w+·Score++w-·Score-。

全文数据:

权利要求:

百度查询: 南京航空航天大学 一种基于语谱图的声音识别的可解释评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。