申请/专利权人:南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司
申请日:2021-10-28
公开(公告)日:2024-01-23
公开(公告)号:CN113905323B
主分类号:H04S7/00
分类号:H04S7/00;B25J11/00
优先权:
专利状态码:有效-授权
法律状态:2024.01.23#授权;2022.01.25#实质审查的生效;2022.01.07#公开
摘要:本发明公开了一种适用于服务型机器人播放音频时的感知声源高度修正方法,包括以下步骤:服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,根据生理高度特征对头相关传递函数HRTF进行匹配,然后对匹配的头相关传递函数HRTF进行微调,卷积本地音频数据,并输出给服务型机器人放音设备。本发明能够有效地实时修正服务型机器人的人机交互声音高度问题,解决了不同的服务型机器人和不同的听者在使用服务型机器人进行人机交互式时的虚拟声像的差异化问题。
主权项:1.一种适用于服务型机器人播放音频时的感知声源高度修正方法,其特征在于,包括以下步骤:步骤1,服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息;步骤2,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,得到人机交互主体听者生理高度特征;服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息的方法:采用红外、超声或图像获取人机交互主体听者的高度信息;步骤3,根据人机交互主体听者生理高度特征对头相关传递函数HRTF数据库中的头相关传递函数HRTF进行匹配,选择对应的头相关传递函数HRTF;步骤4,调用步骤3选择的头相关传递函数HRTF,卷积本地音频数据,并输出给服务型机器人放音设备;步骤5,服务型机器人再次根据多模传感交互方式获取人机交互主体听者生理高度特征;步骤6,服务型机器人实时根据步骤5得到的人机交互主体听者生理高度特征对步骤3匹配得到的头相关传递函数HRTF进行高度微调,得到高度微调后的头相关传递函数HRTF;步骤7,服务型机器人根据步骤6得到高度微调后的头相关传递函数HRTF进行声音微调,得到声音微调后的头相关传递函数HRTF;声音微调方法包括:控制服务型机器人不同放音扬声器的时延,改进虚拟声源仰角的体验;控制服务型机器人调节音效均衡和混响控制;步骤8,调用步骤7得到的声音微调后的头相关传递函数HRTF,卷积本地音频数据,并输出给服务型机器人放音设备;步骤9,重复步骤5-8,直至微调后的头相关传递函数HRTF前后误差在预设的阈值范围内,得到最优的头相关传递函数HRTF;步骤10,调用步骤9得到的最优的头相关传递函数HRTF,卷积本地音频数据,并输出给服务型机器人放音设备。
全文数据:
权利要求:
百度查询: 南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司 适用于服务型机器人播放音频时的感知声源高度修正方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。