买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】音频处理方法、装置及存储介质_腾讯音乐娱乐科技(深圳)有限公司_201810050792.1 

申请/专利权人:腾讯音乐娱乐科技(深圳)有限公司

申请日:2018-01-18

公开(公告)日:2021-01-12

公开(公告)号:CN108281152B

主分类号:G10L21/007(20130101)

分类号:G10L21/007(20130101);G06F3/16(20060101);G06F3/0488(20130101);G06F3/0484(20130101);G10L21/14(20130101)

优先权:

专利状态码:有效-授权

法律状态:2021.01.12#授权;2018.08.07#实质审查的生效;2018.07.13#公开

摘要:本发明是关于一种音频处理方法、装置及存储介质,属于多媒体技术领域。音频处理方法包括:当检测到针对终端上显示的初始音频信号对应的频谱图的涂抹操作后,终端基于该涂抹操作能够处理该频谱图,且可以基于处理后的频谱图,确定目标音频信号,并播放该目标音频信号。本发明实现了直接针对频谱图来处理音频的功能,本发明用于音频的处理。

主权项:1.一种音频处理方法,其特征在于,所述方法包括:显示初始音频信号对应的频谱图;当检测到针对所述频谱图的涂抹操作后,基于所述涂抹操作,处理所述频谱图;基于处理后的所述频谱图,确定目标音频信号;显示处理后的所述频谱图;播放所述目标音频信号;其中,所述频谱图由多帧子频谱图组成,所述涂抹操作为针对目标子频谱图上至少一个子区域进行的操作,所述基于所述涂抹操作,处理所述频谱图,包括:确定与所述至少一个子区域一一对应的至少一个初始处理因子j,0≤j≤1;基于所述至少一个初始处理因子,确定至少一个最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,且若所述最终处理因子为增强因子,则所述最终处理因子为1与所述初始处理因子之和;若所述最终处理因子为弱化因子,则所述最终处理因子为1与所述初始处理因子之差;所述显示值为灰度值或像素值;基于每个最终处理因子对实际作用区域对应的子区域的显示值进行处理。

全文数据:音频处理方法、装置及存储介质技术领域[0001]本发明涉及多媒体技术领域,特别涉及一种音频处理方法、装置及存储介质。背景技术[0002]随着多媒体技术的快速发展,用户对移动终端的播放软件中音频的要求也越来越高,希望可以将原始的音频处理成自己喜欢的音频。[0003]相关技术中,在移动终端上会给出一些可以调节的音频参数,通过采用移动终端中的降噪器、压缩器、混响器等即可以对音频参数进行调整或处理,或者,移动终端上显示有操作按键,该操作按键中对应指定处理功能,(该指定处理功能可以为“变声”和或“变调”功能),用户可以通过触控该操作按键来进行音频的处理。[0004]但是,相关技术中的音频处理方法较为单一。发明内容[0005]本发明实施例提供了一种音频处理方法、装置及存储介质,可以解决相关技术中音频处理方法较为单一的问题,所述技术方案如下:[0006]根据本发明实施例的第一方面,提供了一种音频处理方法,所述方法包括:[0007]显示初始音频信号对应的频谱图;[0008]当检测到针对所述频谱图的涂抹操作后,基于所述涂抹操作,处理所述频谱图;[0009]基于处理后的所述频谱图,确定目标音频信号;[0010]显示处理后的所述频谱图;[0011]播放所述目标音频信号。[0012]可选的,在所述显示初始音频信号对应的频谱图之前,所述方法还包括:[0013]对所述初始音频信号进行第一处理得到FN帧频域信号,所述FN为正整数,所述第一处理包括傅里叶变换;[0014]基于所述FN帧频域信号,生成所述频谱图。[0015]可选的,所述基于处理后的所述频谱图,确定目标音频信号,包括:[0016]基于处理后的所述频谱图,对所述FN帧频域信号中的至少一帧频域信号进行处理,得到处理后的所述FN帧频域信号;[0017]对处理后的所述FN帧频域信号进行第二处理得到所述目标音频信号,所述第二处理包括:傅里叶逆变换。[0018]可选的,所述对所述初始音频信号进行第一处理得到FN帧频域信号,包括:[0019]对所述初始音频信号进行采样得到初始离散音频信号,所述初始离散音频信号的长度为L;[0020]对所述初始离散音频信号进行分帧加窗处理得到FN帧子离散音频信号,FN=L-NFShift+Ι,所述N为每帧所述子离散音频信号的长度,所述FShift为帧移;[0021]分别对每一帧子离散音频信号进行所述傅里叶变换,以得到所述FN帧频域信号。[0022]可选的,所述基于所述FN帧频域信号,生成所述频谱图,包括:[0023]对于每一帧频域信号,将所述频域信号转化为一个分贝数组;[0024]对于每个分贝数组,将截取的前个分贝数值归一化至[B,0]后,将归一化后的分贝数值转化为灰度值,得到一组灰度值数组,所述B为预设值;[0025]基于每组灰度值数组,确定包含个灰度值的一帧子频谱图;[0026]按照对应的离散音频信号的时序,将所有帧子频谱图进行拼接得到包含个灰度值的所述频谱图。[0027]可选的,所述基于处理后的所述频谱图,对所述FN帧频域信号中的至少一帧频域信号进行处理,得到处理后的所述FN帧频域信号,包括:[0028]对于每个目标帧频域信号,确定IXN的一维矩阵,所述IXN的一维矩阵包括N个目标处理因子,所述目标帧频域信号为目标子频谱图对应的所述频域信号,所述目标子频谱图为所述频谱图中,所述涂抹操作所作用的子频谱图,所述目标处理因子反映对所述目标帧频域信号的处理强度;[0029]将所述目标帧频域信号与所述IXN的一维矩阵中对应的目标处理因子的乘积确定为处理后的目标帧频域信号,所述处理后的所述FN帧频域信号包括所述处理后的目标帧频域信号。[0030]可选的,所述对处理后的所述FN帧频域信号进行第二处理得到所述目标音频信号,包括:[0031]分别对每个处理后的目标帧频域信号进行所述傅里叶逆变换,得到对应的目标子离散音频信号;[0032]按照对应的子频谱图的时序,将所有目标子离散音频信号,以及其他子频谱图对应的子离散音频信号进行拼接得到目标离散音频信号,所述其他子频谱图为所述多帧子频谱图中除所述目标子频谱图之外的子频谱图;[0033]将所述目标离散音频信号恢复得到所述目标音频信号。[0034]可选的,所述基于每组灰度值数组,确定包含.个灰度值的一帧子频谱图,包括:[0035]对于每组灰度值数组,将所述灰度值数组进行转置和逆序后,复制所述FShift次,得到包含个灰度值的一帧子频谱图;[0036]所述对于每个目标帧频域信号,确定IXN的一维矩阵,包括:[0037]对于每个所述目标子频谱图,生成:的矩阵,所述:的矩阵中的数值为与所述目标子频谱图的个灰度值一一对应的最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,所述显示值为灰度值或像素值;[0038]求取所述的矩阵中每行最终处理因子的平均值,得到的一维矩阵;[0039]分别基于每个所述的一维矩阵,确定IXN的一维矩阵。[0040]可选的,所述分别基于每个所述的一维矩阵,确定IXN的一维矩阵,包括:[0041]对于每个所述_的一维矩阵factorη,确定IXN的一维矩阵fηη,所述fηη满足:[0044]可选的,所述频谱图由多帧子频谱图组成,所述基于所述涂抹操作,处理所述频谱图,包括:[0045]确定所述涂抹操作所作用的目标子频谱图;[0046]在所述目标子频谱图上确定所述涂抹操作在所述目标子频谱图上的实际作用区域;[0047]对所述目标子频谱图的所述实际作用区域进行处理。[0048]可选的,所述实际作用区域包括至少一个子区域,[0049]所述对所述目标子频谱图的所述实际作用区域进行处理,包括:[0050]确定与所述至少一个子区域--对应的至少一个初始处理因子j,0j时,fnη=factorΝ-η+1:[0347]在本发明实施例中,该频谱图由多帧子频谱图组成,图4Ε是本发明实施例提供的一种第一处理模块402的框图,如图4E所不,该第一处理模块402,包括:[0348]第五确定子模块4021,用于确定涂抹操作所作用的目标子频谱图。[0349]第六确定子模块4022,用于在目标子频谱图上确定涂抹操作在该目标子频谱图上的实际作用区域。[0350]第三处理子模块4023,用于对目标子频谱图的实际作用区域进行处理。[0351]该实际作用区域包括至少一个子区域,相应的,该第三处理子模块4023可以包括:[0352]第七确定子模块,用于确定与该至少一个子区域一一对应的至少一个初始处理因子J·,[0353]第八确定子模块,用于基于该至少一个初始处理因子,确定至少一个最终处理因子,该最终处理因子为反映对目标子频谱图的显示值的处理强度,该显示值可以为灰度值或像素值。[0354]第四处理子模块,用于基于每个最终处理因子对实际作用区域对应子区域的显示值进行处理。[0355]可选的,该实际作用区域可以按照像素划分为至少一个子区域,该第八确定子模块可以用于:[0356]当最终处理因子为增强因子,对于实际作用区域的每个像素对应的初始处理因子,将1与初始处理因子之和作为增强因子;或者当最终处理因子为弱化因子,对于实际作用区域的每个像素对应的初始处理因子,将1与初始处理因子的差值作为弱化因子。[0357]进一步的,该第四处理子模块可以用于将实际作用区域的每个像素的显示值与对应的最终处理因子的乘积作为处理后的每个像素的显示值。[0358]关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。[0359]综上所述,本发明实施例提供了一种音频处理装置,该音频处理装置包括第一显示模块、第一处理模块、确定模块、第二显示模块以及播放模块,其中,该第一处理模块可以基于针对频谱图的涂抹操作,处理第一显示模块在终端上显示的频谱图,在确定模块基于该处理后的频谱图,确定了目标音频信号后。该播放模块即可以在终端上播放该目标音频信号,因此,丰富了终端处理音频的功能。[0360]图5示出了本发明一个示例性实施例提供的终端500的结构框图。该终端500可以是:智能手机、平板电脑、MP3播放器MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3、MP4MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。[0361]通常,终端500包括有:处理器501和存储器502。[0362]处理器501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器501可以采用DSPDigitalSignalProcessing,数字信号处理)、FPGAField—ProgrammableGateArray,现场可编程门阵列)、PLAProgrammableLogicArray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPUCentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以在集成有GPUGraphicsProcessingUnit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AlArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。[0363]存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的音频处理方法。[0364]在一些实施例中,终端500还可选包括有:外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地,外围设备包括:射频电路504、触摸显示屏505、摄像头506、音频电路507、定位组件508和电源509中的至少一种。[0365]外围设备接口503可被用于将10InputOutput,输入输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中,处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上;在一些其他实施例中,处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。[0366]射频电路504用于接收和发射RFRadioFrequency,射频信号,也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络2G、3G、4G及5G、无线局域网和或WiFiWirelessFidelity,无线保真)网络。在一些实施例中,射频电路504还可以包括NFCNearFieldCommunication,近距离无线通信有关的电路,本申请对此不加以限定。[0367]显示屏505用于显示UIUserInterface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时,显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时,显示屏505还可以用于提供虚拟按钮和或虚拟键盘,也称软按钮和或软键盘。在一些实施例中,显示屏505可以为一个,设置终端500的前面板;在另一些实施例中,显示屏505可以为至少两个,分别设置在终端500的不同表面或呈折叠设计;在再一些实施例中,显示屏505可以是柔性显示屏,设置在终端500的弯曲表面上或折叠面上。甚至,显示屏505还可以设置成非矩形的不规则图形,也即异形屏。显示屏505可以采用LCDLiquidCrystalDisplay,液晶显示屏)、OLEDOrganicLight-EmittingDiode,有机发光二极管)等材质制备。[0368]摄像头组件506用于采集图像或视频。可选地,摄像头组件506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VRVirtualReality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。[0369]音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器501进行处理,或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路507还可以包括耳机插孔。[0370]定位组件508用于定位终端500的当前地理位置,以实现导航或LBSLocationBasedService,基于位置的服务)。定位组件508可以是基于美国的GPSGlobalPositioningSystem,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。[0371]电源509用于为终端500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。[0372]在一些实施例中,终端500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于:加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。[0373]加速度传感器511可以检测以终端500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号,控制触摸显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。[0374]陀螺仪传感器512可以检测终端500的机体方向及转动角度,陀螺仪传感器512可以与加速度传感器511协同采集用户对终端500的3D动作。处理器501根据陀螺仪传感器512采集的数据,可以实现如下功能:动作感应比如根据用户的倾斜操作来改变UI、拍摄时的图像稳定、游戏控制以及惯性导航。[0375]压力传感器513可以设置在终端500的侧边框和或触摸显示屏505的下层。当压力传感器513设置在终端500的侧边框时,可以检测用户对终端500的握持信号,由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在触摸显示屏505的下层时,由处理器501根据用户对触摸显示屏505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。[0376]指纹传感器514用于采集用户的指纹,由处理器501根据指纹传感器514采集到的指纹识别用户的身份,或者,由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置终端500的正面、背面或侧面。当终端500上设置有物理按键或厂商Logo时,指纹传感器514可以与物理按键或厂商Logo集成在一起。[0377]光学传感器515用于采集环境光强度。在一个实施例中,处理器501可以根据光学传感器515采集的环境光强度,控制触摸显示屏505的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏505的显示亮度;当环境光强度较低时,调低触摸显示屏505的显示亮度。在另一个实施例中,处理器501还可以根据光学传感器515采集的环境光强度,动态调整摄像头组件506的拍摄参数。[0378]接近传感器516,也称距离传感器,通常设置在终端500的前面板。接近传感器516用于采集用户与终端500的正面之间的距离。在一个实施例中,当接近传感器516检测到用户与终端500的正面之间的距离逐渐变小时,由处理器501控制触摸显示屏505从亮屏状态切换为息屏状态;当接近传感器516检测到用户与终端500的正面之间的距离逐渐变大时,由处理器501控制触摸显示屏505从息屏状态切换为亮屏状态。[0379]本领域技术人员可以理解,图5中示出的结构并不构成对终端500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。[0380]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。[0381]应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

权利要求:1.一种音频处理方法,其特征在于,所述方法包括:显示初始音频信号对应的频谱图;当检测到针对所述频谱图的涂抹操作后,基于所述涂抹操作,处理所述频谱图;基于处理后的所述频谱图,确定目标音频信号;显示处理后的所述频谱图;播放所述目标音频信号。2.根据权利要求1所述的方法,其特征在于,在所述显示初始音频信号对应的频谱图之前,所述方法还包括:对所述初始音频信号进行第一处理得到FN帧频域信号,所述FN为正整数,所述第一处理包括傅里叶变换;基于所述FN帧频域信号,生成所述频谱图。3.根据权利要求2所述的方法,其特征在于,所述基于处理后的所述频谱图,确定目标音频信号,包括:基于处理后的所述频谱图,对所述FN帧频域信号中的至少一帧频域信号进行处理,得到处理后的所述FN帧频域信号;对处理后的所述FN帧频域信号进行第二处理得到所述目标音频信号,所述第二处理包括:傅里叶逆变换。4.根据权利要求2所述的方法,其特征在于,所述对所述初始音频信号进行第一处理得到FN帧频域信号,包括:对所述初始音频信号进行采样得到初始离散音频信号,所述初始离散音频信号的长度为L;对所述初始离散音频信号进行分帧加窗处理得到FN帧子离散音频信号,FN=L-NFShift+Ι,所述N为每帧所述子离散音频信号的长度,所述FShift为帧移;分别对每一帧子离散音频信号进行所述傅里叶变换,以得到所述FN帧频域信号。5.根据权利要求2所述的方法,其特征在于,所述基于所述FN帧频域信号,生成所述频谱图,包括:对于每一帧频域信号,将所述频域信号转化为一个分贝数组;对于每个分贝数组,将截取的前个分贝数值归一化至[B,0]后,将归一化后的分贝数值转化为灰度值,得到一组灰度值数组,所述B为预设值;基于每组灰度值数组,确定包含个灰度值的一帧子频谱图;按照对应的离散音频信号的时序,将所有帧子频谱图进行拼接得到包含个灰度值的所述频谱图。6.根据权利要求5所述的方法,其特征在于,所述基于处理后的所述频谱图,对所述FN帧频域信号中的至少一帧频域信号进行处理,得到处理后的所述FN帧频域信号,包括:对于每个目标帧频域信号,确定IXN的一维矩阵,所述IXN的一维矩阵包括N个目标处理因子,所述目标帧频域信号为目标子频谱图对应的所述频域信号,所述目标子频谱图为所述频谱图中,所述涂抹操作所作用的子频谱图,所述目标处理因子反映对所述目标帧频域信号的处理强度;将所述目标帧频域信号与所述IXN的一维矩阵中对应的目标处理因子的乘积确定为处理后的目标帧频域信号,所述处理后的所述FN帧频域信号包括所述处理后的目标帧频域信号。7.根据权利要求6所述的方法,其特征在于,所述对处理后的所述FN帧频域信号进行第二处理得到所述目标音频信号,包括:分别对每个处理后的目标帧频域信号进行所述傅里叶逆变换,得到对应的目标子离散音频信号;按照对应的子频谱图的时序,将所有目标子离散音频信号,以及其他子频谱图对应的子离散音频信号进行拼接得到目标离散音频信号,所述其他子频谱图为所述多帧子频谱图中除所述目标子频谱图之外的子频谱图;将所述目标离散音频信号恢复得到所述目标音频信号。8.根据权利要求6所述的方法,其特征在于,所述基于每组灰度值数组,确定包含个灰度值的一帧子频谱图,包括:对于每组灰度值数组,将所述灰度值数组进行转置和逆序后,复制所述FShift次,得到包含:个灰度值的一帧子频谱图;所述对于每个目标帧频域信号,确定IXN的一维矩阵,包括:对于每个所述目标子频谱图,生成的矩阵,所述:的矩阵中的数值为与所述目标子频谱图的个灰度值一一对应的最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,所述显示值为灰度值或像素值;求取所述:的矩阵中每行最终处理因子的平均值,得到的一维矩阵;分别基于每个所述的一维矩阵,确定IXN的一维矩阵。9.根据权利要求8所述的方法,其特征在于,所述分别基于每个所述_的一维矩阵,确定IXN的一维矩阵,包括:对于每个所述_的一维矩阵factorη,确定IXN的一维矩阵fnη,所述fnη满足:10.根据权利要求1至9任一所述的方法,其特征在于,所述频谱图由多帧子频谱图组成,所述基于所述涂抹操作,处理所述频谱图,包括:确定所述涂抹操作所作用的目标子频谱图;在所述目标子频谱图上确定所述涂抹操作在所述目标子频谱图上的实际作用区域;对所述目标子频谱图的所述实际作用区域进行处理。11.根据权利要求10所述的方法,其特征在于,所述实际作用区域包括至少一个子区域,所述对所述目标子频谱图的所述实际作用区域进行处理,包括:确定与所述至少一个子区域—对应的至少一个初始处理因子j,〇jl;基于所述至少一个初始处理因子,确定至少一个最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,所述显示值为灰度值或像素值;基于每个最终处理因子对所述实际作用区域对应子区域的显示值进行处理。12.根据权利要求11所述的方法,其特征在于,所述实际作用区域按照像素划分为所述至少一个子区域;所述基于所述至少一个初始处理因子,确定至少一个最终处理因子,包括:当所述最终处理因子为增强因子,对于所述实际作用区域的每个像素对应的初始处理因子,将1与所述初始处理因子之和作为增强因子;当所述最终处理因子为弱化因子,对于所述实际作用区域的每个像素对应的初始处理因子,将1与所述初始处理因子的差值作为弱化因子。13.根据权利要求12所述的方法,其特征在于,所述基于每个最终处理因子对所述实际作用区域对应子区域的显示值进行处理,包括:将所述实际作用区域的每个像素的显示值与对应的最终处理因子的乘积作为处理后的所述每个像素的显示值。14.一种音频处理装置,其特征在于,所述装置包括:第一显示模块,用于显示初始音频信号对应的频谱图;第一处理模块,用于当检测到针对所述频谱图的涂抹操作后,基于所述涂抹操作,处理所述频谱图;确定模块,用于基于处理后的所述频谱图,确定目标音频信号;显示模块,用于显示处理后的所述频谱图;播放模块,用于播放所述目标音频信号。15.根据权利要求14所述的装置,其特征在于,所述装置还包括:第二处理模块,用于在所述显示初始音频信号对应的频谱图之前,对所述初始音频信号进行第一处理得到FN帧频域信号,所述FN为正整数,所述第一处理包括傅里叶变换;生成模块,用于基于所述FN帧频域信号,生成所述频谱图。16.根据权利要求15所述的装置,其特征在于,所述确定模块,包括:第一处理子模块,用于基于处理后的所述频谱图,对所述FN帧频域信号中的至少一帧频域信号进行处理,得到处理后的所述FN帧频域信号;第二处理子模块,用于对处理后的所述FN帧频域信号进行第二处理得到所述目标音频信号,所述第二处理包括:傅里叶逆变换。17.根据权利要求15所述的装置,其特征在于,所述第二处理模块,用于:对所述初始音频信号进行采样得到初始离散音频信号,所述初始离散音频信号的长度为L;对所述初始离散音频信号进行分帧加窗处理得到FN帧子离散音频信号,FN=L-NFShift+Ι,所述N为每帧所述子离散音频信号的长度,所述FShift为帧移;分别对每一帧子离散音频信号进行所述傅里叶变换,以得到所述FN帧频域信号。18.根据权利要求15所述的装置,其特征在于,所述生成模块,包括:第一转化子模块,用于对于每一帧频域信号,将所述频域信号转化为一个分贝数组;第二转化子模块,用于对于每个分贝数组,将截取的前t分贝数值归一化至[B,0]后,将归一化后的分贝数值转化为灰度值,得到一组灰度值数组,所述B为预设值;第一确定子模块,用于基于每组灰度值数组,确定包含个灰度值的一帧子频谱图;拼接子模块,用于按照对应的离散音频信号的时序,将所有帧子频谱图进行拼接得到包含个灰度值的所述频谱图。19.根据权利要求18所述的装置,其特征在于,所述第一处理子模块,包括:第二确定子模块,用于对于每个目标帧频域信号,确定IXN的一维矩阵,所述IXN的一维矩阵包括N个目标处理因子,所述目标帧频域信号为目标子频谱图对应的所述频域信号,所述目标子频谱图为所述频谱图中,所述涂抹操作所作用的子频谱图,所述目标处理因子反映对所述目标帧频域信号的处理强度;第三确定子模块,用于将所述目标帧频域信号与所述IXN的一维矩阵中对应的目标处理因子的乘积确定为处理后的目标帧频域信号,所述处理后的所述FN帧频域信号包括所述处理后的目标帧频域信号。20.根据权利要求19所述的装置,其特征在于,所述第二处理子模块,用于:分别对每个处理后的目标帧频域信号进行所述傅里叶逆变换,得到对应的目标子离散音频信号;按照对应的子频谱图的时序,将所有目标子离散音频信号,以及其他子频谱图对应的子离散音频信号进行拼接得到目标离散音频信号,所述其他子频谱图为所述多帧子频谱图中除所述目标子频谱图之外的子频谱图;将所述目标离散音频信号恢复得到所述目标音频信号。21.根据权利要求19所述的装置,其特征在于,所述第一确定子模块,用于:对于每组灰度值数组,将所述灰度值数组进行转置和逆序后,复制所述FShift次,得到包含t灰度值的一帧子频谱图;所述第二确定子模块,包括:生成子模块,用于对于每个所述目标子频谱图,生成:的矩阵,所a的矩阵中的数值为与所述目标子频谱图的t灰度值一一对应的最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,所述显示值为灰度值或像素值;求取子模块,用于求取所述的矩阵中每行最终处理因子的平均值,得到[的一维矩阵;第四确定子模块,用于分别基于每个所述的一维矩阵,确定IXN的一维矩阵。22.根据权利要求21所述的装置,其特征在于,所述第四确定子模块,用于:对于每个所述的一维矩阵factorη,确定IXN的一维矩阵fnη,所述fnη满足:当.时,fnn=factorη;当时,fnn=factorΝ-η+1,Χη^ΞΝ-1〇23.根据权利要求14至22任一所述的装置,其特征在于,所述频谱图由多帧子频谱图组成,所述第一处理模块,包括:第五确定子模块,用于确定所述涂抹操作所作用的目标子频谱图;第六确定子模块,用于在所述目标子频谱图上确定所述涂抹操作在所述目标子频谱图上的实际作用区域;第三处理子模块,用于对所述目标子频谱图的所述实际作用区域进行处理。24.根据权利要求23所述的装置,其特征在于,所述实际作用区域包括至少一个子区域,所述第三处理子模块,包括:第七确定子模块,用于确定与所述至少一个子区域一一对应的至少一个初始处理因子第八确定子模块,用于基于所述至少一个初始处理因子,确定至少一个最终处理因子,所述最终处理因子为反映对所述目标子频谱图的显示值的处理强度,所述显示值为灰度值或像素值;第四处理子模块,用于基于每个最终处理因子对所述实际作用区域对应子区域的显示值进行处理。25.根据权利要求24所述的装置,其特征在于,所述实际作用区域按照像素划分为所述至少一个子区域;所述第八确定子模块,用于:当所述最终处理因子为增强因子,对于所述实际作用区域的每个像素对应的初始处理因子,将1与所述初始处理因子之和作为增强因子;当所述最终处理因子为弱化因子,对于所述实际作用区域的每个像素对应的初始处理因子,将1与所述初始处理因子的差值作为弱化因子。26.根据权利要求25所述的装置,其特征在于,所述第四处理子模块,用于:将所述实际作用区域的每个像素的显示值与对应的最终处理因子的乘积作为处理后的所述每个像素的显示值。27.—种音频处理装置,其特征在于,包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为:显示初始音频信号对应的频谱图;当检测到针对所述频谱图的涂抹操作后,基于所述涂抹操作,处理所述频谱图;基于处理后的所述频谱图,确定目标音频信号;显示处理后的所述频谱图;播放所述目标音频信号。28.—种存储介质,其特征在于,所述存储介质中存储有指令,当所述存储介质在处理组件上运行时,使得处理组件执行如权利要求1至13任一所述的音频处理方法。

百度查询: 腾讯音乐娱乐科技(深圳)有限公司 音频处理方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。