买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】音频处理的方法和装置_广州酷狗计算机科技有限公司_201811066716.6 

申请/专利权人:广州酷狗计算机科技有限公司

申请日:2018-09-13

公开(公告)日:2021-05-07

公开(公告)号:CN109192218B

主分类号:G10L21/003(20130101)

分类号:G10L21/003(20130101);G10L25/03(20130101);G10L25/18(20130101)

优先权:

专利状态码:有效-授权

法律状态:2021.05.07#授权;2019.02.12#实质审查的生效;2019.01.11#公开

摘要:本发明公开了一种音频处理的方法和装置,属于音频编辑技术领域。所述方法包括:在目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。采用本发明,可以有效解决变声过程中音调改变的技术问题。

主权项:1.一种音频处理的方法,其特征在于,所述方法包括:对源音频进行变调处理得到目标音频,所述源音频是用户的人声音频;显示本地音频列表;当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频;在所述目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;提取所述源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息,提取所述源音频帧的辅音信息,所述基频信息是源音频帧频谱的峰值频率;基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。

全文数据:音频处理的方法和装置技术领域本发明涉及音频编辑技术领域,特别涉及一种音频处理的方法和装置。背景技术现在,很多手机上都有变声软件,对人声进行男女声或者童声大叔声的转换,对于用户来说是一件很有趣味的事情。相关技术中变声的原理为:将源音频每隔几音频帧复制一音频帧,然后将复制的音频帧插入到被复制的音频帧后边,得到时长变长的降速音频。对降速音频进行重采样得到时长与源音频相同的新音频。新音频的音调和音色都发生了改变,从而达到了变声的目的。在实现本发明的过程中,发明人发现相关技术至少存在以下问题:当想要将变调后的人声音频与伴奏音频合成歌曲音频时,有以下两种情况:如果伴奏音频相应的变调,由于伴奏音频的音调改变,伴奏音频的音质就会受损,最后合成的歌曲音频的质量就会下降;如果伴奏音频不变调,那么变调后的人声音频和不变调的伴奏音频不在一个音调上,合成的歌曲音频听觉效果差。发明内容为了解决相关技术中存在的问题,本发明实施例提供了一种音频处理的方法和装置。所述技术方案如下:第一方面,提供了一种音频处理的方法,所述方法包括:在目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。可选的,所述方法还包括:提取所述源音频帧的辅音信息;所述基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧,包括:基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。可选的,所述在目标音频中获取音色参考音频帧之前,还包括:对所述源音频进行变调处理得到所述目标音频。可选的,所述对所述源音频进行变调处理得到所述目标音频,包括:在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。可选的,所述在目标音频中获取音色参考音频帧之前,还包括:显示本地音频列表;当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频。第二方面,提供了一种音频处理的装置,所述装置包括:获取模块,用于在目标音频中获取音色参考音频帧;提取模块,用于提取所述音色参考音频帧的频谱包络特征信息和提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;生成模块,用于基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。可选的,所述提取模块,还用于提取所述源音频帧的辅音信息;所述生成模块,还用于基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。可选的,所述装置还包括:变调模块,用于对所述源音频进行变调处理得到所述目标音频。可选的,所述变调模块,用于在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。可选的,所述装置还包括:显示模块,用于显示本地音频列表;所述获取模块,还用于当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频。第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述第一方面所述的音频处理的方法。第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述第一方面所述的音频处理的方法。本发明实施例提供的技术方案带来的有益效果至少包括:本发明实施例中,由于最终得到的变音色音频帧包含源音频帧的基频信息与音色参考音频帧的频谱包络特征信息,所以,变音色音频的音色改变,达到了变声目的,变音色音频的音调与源音频相同,音调未改变。从而,由于变音色音频的音调不变,伴奏音频的音调也不必改变。变音色音频和伴奏音频的音调都未发生变化,变音色音频可以直接和伴奏音频合成歌曲音频。最终的歌曲音频音质也不会受损,也不会存在听觉效果差的问题。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例提供的一种音频处理的方法的流程图;图2是本发明实施例提供的一种音频处理的方法的流程图;图3是本发明实施例提供的一种音频处理的装置的结构示意图;图4是本发明实施例提供的一种音频处理的终端的结构示意图;图5是本发明实施例提供的一种音频处理的计算机设备的结构示意图;图6是本发明实施例提供的一种歌曲选择界面的示意图;图7是本发明实施例提供的一种K歌界面的示意图;图8是本发明实施例提供的一种变声类别界面的示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明实施例提供了一种音频处理的方法,该方法可以由终端实现。其中,该终端可以是手机、平板电脑、笔记本等移动终端,也可以是台式计算机等固定终端。终端可以包括处理器、存储器、音频输出部件和音频输入部件等。处理器,可以为CPUCentralProcessingUnit,中央处理单元等,可以用于编辑音频文件,控制显示器进行显示等处理。存储器,可以为RAMRandomAccessMemory,随机存取存储器,Flash闪存等,可以用于存储接收到的数据、处理过程所需的数据、处理过程中生成的数据等,如音色参考音频帧、源音频帧、变音色音频帧等。音频输出部件可以是音箱、耳机等。音频输入部件可以是麦克风等。终端还可以包括输入部件、屏幕等。输入部件,可以为鼠标、触控屏、触控板、键盘等,可以基于用户的操作生成相应的指令。屏幕可以是触控屏或非触控屏,可以用于显示应用程序的操作界面等。如图1所示,该方法的处理流程可以包括如下的步骤:在步骤101中,对源音频进行变调处理得到目标音频。其中,源音频可以是用户的人声音频。在实施中,用户可以在终端上安装用于K歌和音频处理的应用程序,当用户想要K歌并对自己的歌声进行变声处理时,可以点击快捷图标运行该应用程序,并在应用程序的主界面中选择K歌的功能选项。此时,应用程序中会显示歌曲选择界面如图6所示,歌曲选择界面中可以显示音频列表,音频列表中包括多个歌曲音频的选项,用户可以浏览音频列表,点击选择自己想要唱的歌曲音频的选项。选择完毕后,应用程序进入K歌界面如图7所示。终端播放该歌曲音频中的伴奏,并且可以在屏幕上显示歌词。同时,终端会启动音频输入部件如麦克风,进行音频录制,用户可以随着伴奏进行歌唱,终端将录制下来的人声音频作为源音频。人声音频录制完成后,应用程序中会显示变声类别界面如图8所示,变声类别界面中可以显示声音类型列表,声音类型列表中可以显示多个声音类型选项,用户可以浏览声音类型列表,点击选择自己想要变的声音类型选项。假如用户想变声为童声,则他可以点击童声选项。然后,终端会对用户的源音频进行向童声改变的变调处理。将源音频变调处理后即得到目标音频。可选的,变调处理可以选择soundtouch算法一种音频变调算法、频域变调法或参数变调法变调,以soundtouch算法为例,soundtouch算法的变调原理如下:在源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制该第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到源音频对应的降速音频;对该降速音频进行重采样,得到与源音频的帧数目相同且时长相同的目标音频。其中,第一预设数目与第二预设数目的具体数值可以是固定数值,也可以根据源音频的基频和用户选择的声音类型对应的基频来确定。在步骤102中,在目标音频中获取音色参考音频帧,提取该音色参考音频帧的频谱包络特征信息。其中,音色参考音频帧的频谱包络特征信息,是用于描述频谱曲线的形状特征的信息,频谱包络特征信息可以表征音色。在实施中,在生成目标音频之后,可以在目标音频中,从第一个音频帧开始,按照播放顺序逐个获取其中的音频帧,即音色参考音频帧。然后,对获取的音色参考音频帧,提取音色参考音频帧的基频信息,然后结合该基频信息提取音色参考音频帧的频谱包络特征信息。在步骤103中,提取源音频中与音色参考音频帧的播放时间点相同的源音频帧的基频信息。其中,基频信息可以是音频帧频谱的峰值频率。在实施中,终端在音色参考音频帧中提取频谱包络特征信息的同时,可以在源音频中获取与音色参考音频帧的播放时间点相同的源音频帧。由上述的基于源音频生成目标音频的处理过程可知,源音频和目标音频的帧数目和时长相同。所以,在目标音频中获取第一个音频帧作为音色参考音频帧的同时,可以在源音频中获取第一个源音频帧,在目标音频中获取第二个音频帧作为音色参考音频帧的同时,可以在源音频中获取第二个源音频帧,这样,获取的源音频帧和音色参考音频帧具有相同的播放时间点。在获取源音频帧后,可以提取源音频帧的基频信息。可选的,为了使得变声效果更加自然真实,还可以提取源音频中的辅音信息。在实施中,基于上述源音频生成目标音频的处理过程。在获取源音频帧后,可以将源音频帧的基频信息和辅音信息全部提取出来。在步骤104中,基于基频信息和频谱包络特征信息,生成源音频帧对应的变音色音频帧。在实施中,终端可以调用world工具一种可以生成音频的工具生成新的人声音频。将源音频的基频信息和目标音频的频谱包络特征信息输入到world工具中,world工具会生成新的人声音频。该人声音频具有源音频的基频信息和目标音频的频谱包络特征信息,所以,该人声音频的音调与源音频一致,音色与目标音频一致。总体的效果是变声后的人声音频与初始录制的人声音频相比音色改变音调不变。可选的,基于上述提取的源音频帧的辅音信息,步骤104相应的处理过程如下:基于基频信息、频谱包络特征信息和辅音信息,生成源音频帧对应的变音色音频帧。在实施中,终端可以调用world工具一种可以生成音频的工具生成新的人声音频。将源音频的基频信息、源音频的辅音信息和目标音频的频谱包络特征信息输入到world工具中,world工具会生成新的人声音频。该人声音频具有源音频的基频信息和目标音频的频谱包络特征信息,所以,该人声音频的音调与源音频一致,音色与目标音频一致。由于,该人声音频还具有源音频的辅音信息,所以,该人声音频与只基于基频信息和频谱包络特征信息生成的人声音频相比,听起来声音更加自然。最终,变声完成后,用户可以点击试听按钮,终端播放变音色音频与伴奏音频。如果用户对变声效果满意,用户可以点击保存按钮,将变音色音频与伴奏音频合成新的歌曲音频保存在本地文件中;如果用户对变声效果不满意,用户可以点击重录按钮,重新录制并进行变声操作。用户还可以点击发布按钮,选择将新的歌曲音频上传到网上。如图2所示,该方法的处理流程可以包括如下的步骤:在步骤201中,显示本地音频列表。当接收到对本地音频列表中的目标音频的选项的选取指令时,获取目标音频。其中,目标音频可以是预先存储在终端上的人声音频。在实施中,用户可以在终端上安装用于K歌和音频处理的应用程序,当用户想要K歌并对自己的歌声进行变声处理时,可以点击快捷图标运行该应用程序,并在应用程序的主界面中选择K歌的功能选项。此时,应用程序中会显示歌曲选择界面如图6所示,歌曲选择界面中可以显示音频列表,音频列表中包括多个歌曲音频的选项,用户可以浏览音频列表,点击选择自己想要唱的歌曲音频的选项。选择完毕后,应用程序进入K歌界面如图7所示。终端播放该歌曲音频中的伴奏,并且可以在屏幕上显示歌词。终端将该歌曲音频中的人声音频作为目标音频。同时,终端会启动音频输入部件如麦克风,进行音频录制,用户可以随着伴奏进行歌唱,终端将录制下来的人声音频作为源音频。在步骤202中,在目标音频中获取音色参考音频帧,提取该音色参考音频帧的频谱包络特征信息。具体实施过程参照步骤102。在步骤203中,提取源音频中与音色参考音频帧的播放时间点相同的源音频帧的基频信息。具体实施过程参照步骤103。在步骤204中,基于基频信息和所频谱包络特征信息,生成所源音频帧对应的变音色音频帧。具体实施过程参照步骤104。基于相同的技术构思,本发明实施例还提供了一种音频处理的装置,该装置可以为上述实施例中的终端,如图3所示,该装置包括:获取模块301,用于在目标音频中获取音色参考音频帧;提取模块302,用于提取音色参考音频帧的频谱包络特征信息和提取源音频中与音色参考音频帧的播放时间点相同的源音频帧的基频信息;生成模块303,用于基于基频信息和频谱包络特征信息,生成源音频帧对应的变音色音频帧。可选的,提取模块302,还用于提取源音频帧的辅音信息;生成模块303,还用于基于基频信息、频谱包络特征信息和辅音信息,生成源音频帧对应的变音色音频帧。可选的,所述装置还包括:变调模块304,用于对源音频进行变调处理得到目标音频。可选的,变调模块304,用于在源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到源音频对应的降速音频;对降速音频进行重采样,得到与源音频的帧数目相同且时长相同的目标音频。可选的,所述装置还包括:显示模块305,用于显示本地音频列表;获取模块306,还用于当接收到对本地音频列表中的目标音频的选项的选取指令时,获取目标音频。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。需要说明的是:上述实施例提供的音频处理的装置在音频处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频处理的装置与音频处理的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。图4是本发明实施例提供的一种终端的结构框图。该终端400可以是便携式移动终端,比如:智能手机、平板电脑。终端400还可能被称为用户设备、便携式终端等其他名称。通常,终端400包括有:处理器401和存储器402。处理器401可以包括一个或多个处理核心,比如4核心处理器、4核心处理器等。处理器401可以采用DSPDigitalSignalProcessing,数字信号处理、FPGAField-ProgrammableGateArray,现场可编程门阵列、PLAProgrammableLogicArray,可编程逻辑阵列中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPUCentralProcessingUnit,中央处理器;协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPUGraphicsProcessingUnit,图像处理器,GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AIArtificialIntelligence,人工智能处理器,该AI处理器用于处理有关机器学习的计算操作。存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是有形的和非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器401所执行以实现本申请中提供的音频处理的方法。在一些实施例中,终端400还可选包括有:外围设备接口403和至少一个外围设备。具体地,外围设备包括:射频电路404、触摸显示屏405、摄像头406、音频电路407、定位组件408和电源409中的至少一种。外围设备接口403可被用于将IOInputOutput,输入输出相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中,处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上;在一些其他实施例中,处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。射频电路404用于接收和发射RFRadioFrequency,射频信号,也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络2G、3G、4G及5G、无线局域网和或WiFiWirelessFidelity,无线保真网络。在一些实施例中,射频电路404还可以包括NFCNearFieldCommunication,近距离无线通信有关的电路,本申请对此不加以限定。触摸显示屏405用于显示UIUserInterface,用户界面。该UI可以包括图形、文本、图标、视频及其它们的任意组合。触摸显示屏405还具有采集在触摸显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。触摸显示屏405用于提供虚拟按钮和或虚拟键盘,也称软按钮和或软键盘。在一些实施例中,触摸显示屏405可以为一个,设置终端400的前面板;在另一些实施例中,触摸显示屏405可以为至少两个,分别设置在终端400的不同表面或呈折叠设计;在再一些实施例中,触摸显示屏405可以是柔性显示屏,设置在终端400的弯曲表面上或折叠面上。甚至,触摸显示屏405还可以设置成非矩形的不规则图形,也即异形屏。触摸显示屏405可以采用LCDLiquidCrystalDisplay,液晶显示器、OLEDOrganicLight-EmittingDiode,有机发光二极管等材质制备。摄像头组件406用于采集图像或视频。可选地,摄像头组件406包括前置摄像头和后置摄像头。通常,前置摄像头用于实现视频通话或自拍,后置摄像头用于实现照片或视频的拍摄。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能,主摄像头和广角摄像头融合实现全景拍摄以及VRVirtualReality,虚拟现实拍摄功能。在一些实施例中,摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。音频电路407用于提供用户和终端400之间的音频接口。音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器401进行处理,或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路407还可以包括耳机插孔。定位组件408用于定位终端400的当前地理位置,以实现导航或LBSLocationBasedService,基于位置的服务。定位组件408可以是基于美国的GPSGlobalPositioningSystem,全球定位系统、中国的北斗系统或俄罗斯的伽利略系统的定位组件。电源409用于为终端400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。在一些实施例中,终端400还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于:加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。加速度传感器411可以检测以终端400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器401可以根据加速度传感器411采集的重力加速度信号,控制触摸显示屏405以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。陀螺仪传感器412可以检测终端400的机体方向及转动角度,陀螺仪传感器412可以与加速度传感器411协同采集用户对终端400的3D动作。处理器401根据陀螺仪传感器412采集的数据,可以实现如下功能:动作感应比如根据用户的倾斜操作来改变UI、拍摄时的图像稳定、游戏控制以及惯性导航。压力传感器413可以设置在终端400的侧边框和或触摸显示屏405的下层。当压力传感器413设置在终端400的侧边框时,可以检测用户对终端400的握持信号,根据该握持信号进行左右手识别或快捷操作。当压力传感器413设置在触摸显示屏405的下层时,可以根据用户对触摸显示屏405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。指纹传感器414用于采集用户的指纹,以根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置终端400的正面、背面或侧面。当终端400上设置有物理按键或厂商Logo时,指纹传感器414可以与物理按键或厂商Logo集成在一起。光学传感器415用于采集环境光强度。在一个实施例中,处理器401可以根据光学传感器415采集的环境光强度,控制触摸显示屏405的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏405的显示亮度;当环境光强度较低时,调低触摸显示屏405的显示亮度。在另一个实施例中,处理器401还可以根据光学传感器415采集的环境光强度,动态调整摄像头组件406的拍摄参数。接近传感器416,也称距离传感器,通常设置在终端400的正面。接近传感器416用于采集用户与终端400的正面之间的距离。在一个实施例中,当接近传感器416检测到用户与终端400的正面之间的距离逐渐变小时,由处理器401控制触摸显示屏405从亮屏状态切换为息屏状态;当接近传感器416检测到用户与终端400的正面之间的距离逐渐变大时,由处理器401控制触摸显示屏405从息屏状态切换为亮屏状态。本领域技术人员可以理解,图4中示出的结构并不构成对终端400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。在示例性实施例中,还提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述实施例中的识别动作类别的方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器RAM、CD-ROM、磁带、软盘和光数据存储设备等。图5是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器centralprocessingunits,CPU501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述音频处理的方法。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种音频处理的方法,其特征在于,所述方法包括:在目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:提取所述源音频帧的辅音信息;所述基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧,包括:基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。3.根据权利要求1所述的方法,其特征在于,所述在目标音频中获取音色参考音频帧之前,还包括:对所述源音频进行变调处理得到所述目标音频。4.根据权利要求3所述的方法,其特征在于,所述对所述源音频进行变调处理得到所述目标音频,包括:在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。5.根据权利要求1所述的方法,其特征在于,所述在目标音频中获取音色参考音频帧之前,还包括:显示本地音频列表;当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频。6.一种音频处理的装置,其特征在于,所述装置包括:获取模块,用于在目标音频中获取音色参考音频帧;提取模块,用于提取所述音色参考音频帧的频谱包络特征信息,提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;生成模块,用于基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。7.根据权利要求6所述的装置,其特征在于,所述提取模块,还用于提取所述源音频帧的辅音信息;所述生成模块,用于基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。8.根据权利要求6所述的装置,其特征在于,所述装置还包括:变调模块,用于对所述源音频进行变调处理得到所述目标音频。9.根据权利要求8所述的装置,其特征在于,所述变调模块,用于:在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。10.根据权利要求6所述的装置,其特征在于,所述装置还包括:显示模块,用于显示本地音频列表;所述获取模块,还用于当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频。11.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至6任一所述的音频处理的方法。12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至6任一所述的音频处理的方法。

百度查询: 广州酷狗计算机科技有限公司 音频处理的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。