恭喜上证所信息网络有限公司李昊勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上证所信息网络有限公司申请的专利一种基于语音识别和声纹识别大模型Cam++的说话人区分方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119541503B 。
龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510080553.0,技术领域涉及:G10L17/06;该发明授权一种基于语音识别和声纹识别大模型Cam++的说话人区分方法是由李昊勇;赵洋明;陈文军;楼旦;徐俊轩设计研发完成,并于2025-01-20向国家知识产权局提交的专利申请。
本一种基于语音识别和声纹识别大模型Cam++的说话人区分方法在说明书摘要公布了:本申请涉及语音声纹识别技术领域,提供一种基于语音识别和声纹识别大模型Cam++的说话人区分方法,方法包括:通过语音识别大模型Cam++获取输入音频中每句话对应的开始时间戳和结束时间戳,并根据开始时间戳和结束技术间戳切分出每句话对应的音频片段;过滤时长低于预设时长阈值的音频片段;将过滤后的音频片段输入声纹识别大模型Cam++,获取每个音频片段的声纹特征向量;获取初始K‑means聚类数;初始K‑means聚类,取出偏离的异常特征向量;对被取出的偏离异常特征向量进行二次处理;聚类合并分组;处理所有未分组片段。本申请使用先进的大模型,提高大模型本身声纹识别的准确率,同时提高区分说话人的颗粒度,做多层K‑means区分,提高说话人分组数量准确性。
本发明授权一种基于语音识别和声纹识别大模型Cam++的说话人区分方法在权利要求书中公布了:1.一种基于语音识别和声纹识别大模型Cam++的说话人区分方法,其特征在于,所述方法包括:步骤S1:通过语音识别大模型Cam++获取输入音频中每句话对应的开始时间戳和结束时间戳,并根据所述开始时间戳和结束技术间戳切分出每句话对应的音频片段;步骤S2:取出时长低于预设时长阈值的音频片段;步骤S3:将经过步骤S2后的音频片段输入所述声纹识别大模型Cam++的,获取每个音频片段的声纹特征向量;步骤S1至步骤S3用于获取每个音频片段的声纹特征向量;步骤S4:获取初始K-means聚类数量,所述步骤S4包括通过肘部法则和轮廓法则计算初始K-means聚类数量,得到肘部法则聚类数量和轮廓法则聚类数量,取较大值作为所述初始K-means聚类数量;步骤S5:初始K-means聚类,取出偏离的异常特征向量,所述步骤S5包括根据所述初始K-means聚类数量,对所述声纹特征向量基于欧氏距离作K-means聚类,得到K个声纹特征向量组,同时根据所述初始K-means聚类数量K,将所述声纹特征向量组打上说话人标签,所述说话人标签为数字i,1≤i≤K,i为整数,并根据聚类内相似度,取出每个声纹特征向量组里偏离的异常特征向量;步骤S6:通过所述步骤S4和所述步骤S5对被取出的偏离异常特征向量进行二次处理,所述步骤S6包括通过所述步骤S4和所述步骤S5再次处理所有被取出的偏离的异常特征向量,并取出经过再次处理后依旧偏离的异常特征向量;步骤S4至步骤S6用于对声纹特征向量基于欧氏距离作K-means聚类,同时取出偏离的异常特征向量;步骤S7:聚类合并所述步骤S5和所述步骤S6得到的分组,所述步骤S7包括对所述步骤S5和所述步骤S6聚类得到的声纹特征向量组,根据聚类间差异度进行组间相似度判断,若其中两组间平均相似度大于等于预设组间相似度阈值,则将两组合并,同时合并分别与两组对应的两个说话人标签为一个说话人标签;步骤S8:处理所有未分组片段,所述步骤S8包括对于所述步骤S2和所述步骤S6中所有被取出的片段,标注该片段前一个片段及后一个片段的说话人标签,若前一个片段为已分组片段,则使用该片段的说话人标签作为前一个说话人标签,若前一个片段为未分组片段,则继续向前搜索,直到找到一个已分组的片段,并使用其说话人标签;或若后一个片段为已分组片段,则使用该片段的说话人标签作为后一个说话人标签,若后一个片段为未分组片段,则继续向后搜索,直到找到一个已分组的片段,并使用其说话人标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上证所信息网络有限公司,其通讯地址为:201203 上海市浦东新区中国(上海)自由贸易试验区张东路1387幢37号101(复式);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。