买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】多声道音频内容的编码_杜比国际公司_201710504258.9 

申请/专利权人:杜比国际公司

申请日:2014-09-08

公开(公告)日:2020-10-23

公开(公告)号:CN107134280B

主分类号:G10L19/008(20130101)

分类号:G10L19/008(20130101)

优先权:["20130912 US 61/877,189","20131021 US 61/893,770","20140401 US 61/973,628"]

专利状态码:有效-授权

法律状态:2020.10.23#授权;2017.09.29#实质审查的生效;2017.09.05#公开

摘要:本发明公开了多声道音频内容的编码。提供了用于对多声道音频内容进行编码和解码以供在具有N个声道的扬声器配置上回放的解码和编码方法。该解码方法包括:在第一解码模块中将M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号;并且对于所述N个声道中的超过M个声道的每一个,接收与所述M个中间信号中的一个对应的另外的输入音频信号,以及对输入音频信号及其对应的中间信号进行解码以便产生立体声信号,该立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号。

主权项:1.一种用于对编码的音频信号进行解码的方法,所述方法包括:接收多个输入音频信号,所述多个输入音频信号包括第一波形编码信号和第二波形编码信号,所述第一波形编码信号包括与直到第一频率的频率对应的谱数据,所述第二波形编码信号包括与直到第二频率的频率对应的谱数据,所述第二频率高于所述第一频率;对所述第一波形编码信号进行解码以产生第一解码音频信号,所述第一解码音频信号具有直到所述第一频率的频率,所述第一解码音频信号表示侧边信号;对所述第二波形编码信号进行解码以产生第二解码音频信号,所述第二解码音频信号具有直到所述第二频率的频率,所述第二解码音频信号表示中间信号;对所述第一解码信号和第二解码信号执行增强的逆向的和差变换以产生直到所述第一频率的立体声音频信号,其中,所述增强的逆向的和差变换包括向所述中间信号应用加权参数;对所述第二解码信号执行逆向的和差变换以产生直到所述第二频率的立体声音频信号;以及将具有直到所述第一频率的频率的立体声音频信号与具有直到所述第二频率的频率的立体声音频信号进行组合。

全文数据:多声道音频内容的编码[0001]本申请是基于申请号为201480050044.3、申请日为2014年9月8日、发明名称为“多声道音频内容的编码”的专利申请的分案申请。技术领域[0002]本文中的公开一般涉及多声道音频信号的编码。特别地,它涉及一种用于多个输入音频信号的编码和解码以供在具有某一数量的声道的扬声器配置上回放的编码器和解码器。背景技术[0003]多声道音频内容对应于具有某一数量的声道的扬声器配置。例如,多声道音频内容可以对应于具有五个前声道、四个环绕声道、四个天花板声道、以及低频效果LFE声道的扬声器配置。这样的声道配置可以被称为544.I、9.1+4或13.1配置。有时,期望在具有声道即,扬声器少于编码的多声道音频内容的扬声器配置的回放系统上回放编码的多声道音频内容。在下面,这样的回放系统被称为旧有回放系统。例如,可能期望在具有三个前声道、两个环绕声道、两个天花板声道、以及LFE声道的扬声器配置上回放编码的13.1音频内容。这样的声道配置也被称为322.1、5.1+2或7.1配置。[0004]根据现有技术,原始多声道音频内容的所有声道的完整解码接着下混到旧有回放系统的声道配置将被需要。显然,这样的方法在计算上是低效的,因为原始多声道音频内容的所有声道都需要被解码。因此需要一种允许直接对适合于旧有回放系统的下混进行解码的编码方案。附图说明[0005]现在将参照附图来描述示例实施例,在附图上:[0006]图1示出根据示例实施例的解码方案,[0007]图2示出与图1的解码方案对应的编码方案,[0008]图3示出根据示例实施例的解码器,[0009]图4和图5分别示出根据示例实施例的解码模块的第一和第二配置,[0010]图6和图7示出根据示例实施例的解码器,[0011]图8示出图7的解码器中使用的高频重构组件,[0012]图9示出根据示例实施例的编码器,[0013]图10和图11分别示出根据示例实施例的编码模块的第一和第二配置。[0014]所有的附图都是示意性的,并且一般仅示出了为了阐明本公开而必要的部分,而其它部分则可以被省略或者仅仅被建议。除非另外指出,否则同样的附图标记在不同的附图中指代同样的部分。具体实施方式[0015]鉴于以上,因此目的在于提供用于多声道音频内容的编码解码的编码解码方法,其允许适合于旧有回放系统的下混的高效解码。[0016]I.概述一解码器[0017]根据第一方面,提供了用于对多声道音频内容进行解码的解码方法、解码器、以及计算机程序产品。[0018]根据示例性实施例,提供了一种用于对多个输入音频信号进行解码以供在具有N个声道的扬声器配置上回放的解码器中的方法,所述多个输入音频信号表示与至少N个声道对应的编码的多声道音频内容,所述方法包括:[0019]接收M个输入音频信号,其中,1〈M彡N彡2M;[0020]在第一解码模块中将所述M个输入音频信号解码为适合于在具有m个声道的扬声器配置上回放的M个中间信号midsignal;[0021]对于所述N个声道中的超过M个声道的每一个:[0022]接收与所述M个中间信号中的一个对应的另外的additional输入音频信号,所述另外的输入音频信号是侧边信号(sidesignal或者连同中间信号和加权参数a—起允许重构侧边信号的补充信号complementarysignal;[0023]在立体声解码模块中对所述另外的输入音频信号及其对应的中间信号进行解码以便产生立体声信号,所述立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号;[0024]由此,产生适合于在扬声器配置的N个声道上回放的N个音频信号。[0025]以上方法是有利的,因为在音频内容将在旧有回放系统上回放的情况下,解码器不必对多声道音频内容的所有声道进行解码并且形成完整多声道音频内容的下混。[0026]更详细地,被设计为对与M声道扬声器配置对应的音频内容进行解码的旧有解码器可以简单地使用M个输入音频信号并将这些解码为适合于在M声道扬声器配置上回放的M个中间信号。在解码器侧不需要音频内容的进一步下混。事实上,适合于旧有回放扬声器配置的下混在编码器侧已经被准备好并被编码,并且由所述M个输入音频信号表示。[0027]被设计为对与多于M个的声道对应的音频内容进行解码的解码器可以接收另外的输入音频信号并借助于立体声解码技术将这些与M个中间信号中的对应几个组合,以便达到与期望的扬声器配置对应的输出声道。因此,提议的方法是有利的,因为关于将被用于回放的扬声器配置它是灵活的。[0028]根据示例实施例,所述立体声解码模块可在依赖于所述解码器按其接收数据的比特率的至少两个配置中操作。所述方法可以还包括接收关于所述至少两个配置中的哪个用在对所述另外的输入音频信号及其对应的中间信号进行解码的步骤中的指示。[0029]这是有利的,因为关于编码解码系统使用的比特率该解码方法是灵活的。[0030]根据示例性实施例,接收另外的输入音频信号的步骤包括:[0031]接收一对音频信号,所述一对音频信号对应于与所述M个中间信号中的第一个对应的另外的输入音频信号和与所述M个中间信号中的第二个对应的另外的输入音频信号的联合编码;和[0032]对所述一对音频信号进行解码以便产生分别与所述M个中间信号中的第一个和第二个对应的另外的输入音频信号。[0033]这是有利的,因为另外的输入音频信号可以被成对地高效编码。[0034]根据示例性实施例,所述另外的输入音频信号是包括与直到第一频率的频率对应的谱数据的波形编码信号,并且所述对应的中间信号是包括与直到比所述第一频率大的频率的频率对应的谱数据的波形编码信号,并且其中,根据所述立体声解码模块的第一配置对所述另外的输入音频信号及其对应的中间信号进行解码的步骤包括以下步骤:[0035]如果所述另外的音频输入信号是补充信号的形式,则通过将中间信号与加权参数a相乘并将乘法的结果与补充信号相加来计算对于直到所述第一频率的频率的侧边信号;和[0036]对所述中间信号和侧边信号进行上混以便产生包括第一音频信号和第二音频信号的立体声信号,其中,对于低于所述第一频率的频率,所述上混包括执行所述中间信号和侧边信号的逆向的和与差sum-and-difference变换,而对于高于所述第一频率的频率,所述上混包括执行所述中间信号的参数化上混。[0037]这是有利的,因为由立体声解码模块所执行的解码使得能够进行中间信号和对应的另外的输入音频信号的解码,其中,所述另外的输入音频信号被波形编码直到比对于中间信号的对应频率低的频率。以这种方式,该解码方法允许编码解码系统以降低的比特率操作。[0038]通过执行中间信号的参数化上混一般意指对于尚于所述第一频率的频率,所述第一音频信号和第二音频信号基于中间信号被参数化重构。[0039]根据示例性实施例,所述波形编码的中间信号包括与直到第二频率的频率对应的谱数据,所述方法还包括:[0040]在执行参数化上混之前通过执行高频重构来将所述中间信号扩展到高于所述第二频率的频率范围。[0041]以这种方式,该解码方法允许编码解码系统以甚至进一步降低的比特率操作。[0042]根据示例性实施例,所述另外的输入音频信号和对应的中间信号是包括与直到第二频率的频率对应的谱数据的波形编码信号,并且根据所述立体声解码模块的第二配置对所述另外的输入音频信号及其对应的中间信号进行解码的步骤包括以下步骤:[0043]如果所述另外的音频输入信号是补充信号的形式,则通过将中间信号与加权参数a相乘并将乘法的结果与补充信号相加来计算侧边信号;和[0044]执行所述中间信号和侧边信号的逆向的和与差变换以便产生包括第一音频信号和第二音频彳目号的立体声信号。[0045]这是有利的,因为由立体声解码模块所执行的解码进一步使得能够进行中间信号和对应的另外的输入音频信号的解码,其中,所述另外的输入音频信号被波形编码直到相同的频率。以这种方式,该解码方法允许编码解码系统也以高比特率操作。[0046]根据示例性实施例,所述方法还包括:通过执行高频重构来将所述立体声信号的第一音频信号和第二音频信号扩展到高于所述第二频率的频率范围。这是有利的,因为关于编码解码系统的比特率的灵活性进一步增加。[0047]根据示例性实施例,在所述M个中间信号将在具有M个声道的扬声器配置上回放的情况下,所述方法还可以包括:[0048]通过基于高频重构参数执行高频重构来扩展所述M个中间信号中的至少一个的频率范围,所述高频重构参数与可以从所述M个中间信号中的所述至少一个及其对应的另外的音频输入信号产生的立体声信号的第一音频信号和第二音频信号相关联。[0049]这是有利的,因为高频重构的中间信号的质量可以被改进。[0050]根据示例性实施例,在所述另外的输入音频信号为侧边信号的形式的情况下,使用具有不同变换大小的修正离散余弦变换来对所述另外的输入音频信号和对应的中间信号进行波形编码。这是有利的,因为关于选择变换大小的灵活性被增加。[0051]示例性实施例还涉及一种包括计算机可读介质的计算机程序产品,所述计算机可读介质具有用于执行以上公开的编码方法中的任何一个的指令。所述计算机可读介质可以是非暂时性计算机可读介质。[0052]示例性实施例还涉及一种用于对多个输入音频信号进行解码以供在具有N个声道的扬声器配置上回放的解码器,所述多个输入音频信号表示与至少N个声道对应的编码的多声道音频内容,所述解码器包括:[0053]接收组件,所述接收组件被配置为接收M个输入音频信号,其中,12被接收组件未示出接收。该K个输入音频信号被输入到第一编码模块206。基于K个输入音频信号228,第一编码模块206产生K-M个输出音频信号224和适合于在具有M个声道的扬声器配置上回放的M个中间信号226,其中,MK彡2M。[0125]一般地,如下面将更详细地解释的,M个中间信号226中的一些通常是中间信号226中的2M-K个对应于K个输入音频信号228中的相应的一个。换句话说,第一编码模块206靠使K个输入音频信号228中的一些通过来产生M个中间信号226中的一些。[0126]M个中间信号226中的剩余的K-M个一般通过对没有通过第一编码模块206的输入音频信号228进行下混(g卩,线性组合而产生。特别地,第一编码模块可以成对地对这些输入音频信号228进行下混。出于这个目的,第一编码模块可以包括一个或多个通常是K-M个立体声编码模块,每个立体声编码模块对一对输入音频信号228进行操作以产生中间信号(即,下混或和信号)和对应的输出音频信号224。根据以上讨论的两个替代方案中的任何一个,该输出音频信号224对应于中间信号,S卩,输出音频信号224是侧边信号或者连同中间信号和加权参数a—起允许侧边信号的重构的补充信号。在后一种情况下,加权参数a被包括在数据流220中。[0127]M个中间信号226然后被输入到第二编码模块204,在该第二编码模块204中,它们被编码为M个另外的输出音频信号222。第二编码模块204—般可以根据任何已知的用于对与M个声道对应的音频内容进行编码的编码方案进行操作。[0128]M个另外的输出音频信号222和来自第一编码模块的N-M个输出音频信号224然后通过复用组件202量化并包括在数据流220中以供传输到解码器。[0129]在参照图1-2描述的编码解码方案的情况下,K声道音频内容到M声道音频内容的适当下混在编码器侧(由第一编码模块206执行。以这种方式,实现了K声道音频内容的高效解码以供在具有M个声道或者更一般地,N个声道的声道配置上回放,其中,MNK。[0130]下面将参照图3-8来描述解码器的示例实施例。[0131]图3示出被配置用于多个输入音频信号的解码以供在具有N个声道的扬声器配置上回放的解码器300。该解码器300包括接收组件302、第一解码模块104、第二解码模块106,该第二解码模块106包括立体声解码模块306。第二解码模块106还可以包括高频扩展组件308。解码器300还可以包括立体声转换组件310。[0132]下面将描述解码器3〇0的操作。接收组件3〇2从编码器接收数据流320S卩,比特流)。该接收组件302可以例如包括用于将数据流320解复用为其组成部分的解复用组件和用于接收的数据的解量化的解量化器。[0133]接收的数据流320包括多个输入音频信号。一般地,该多个输入音频信号可以对应于与具有K个声道的扬声器配置对应的编码的多声道音频内容,其中,K3N。[0134]特别地,数据流320包括M个输入音频信号322,其中,1〈M〈N。在示出的示例中,M等于七,使得存在七个输入音频信号322。然而,根据其它示例,可以取其它数字,诸如五个。而且,数据流320包括N-M个音频信号323,N-M个输入音频信号324可以从该N-M个音频信号323解码。在示出的示例中,N等于十三,使得存在六个另外的输入音频信号324。[0135]数据流320还可以包括另外的音频信号321,该另外的音频信号321通常对应于编码的LFE声道。[0136]根据示例,N-M个音频信号323的一对可以对应于N-M个输入音频信号324的一对的联合编码。立体声转换组件310可以对N-M个音频信号323的这样的对进行解码以产生N-M个输入音频信号324的对应对。例如,立体声转换组件310可以通过将MS或增强的MS解码应用于N-M个音频信号323的所述对来执行解码。[0137]M个输入音频信号322和另外的音频信号321如果可用的话被输入到第一解码模块104。如参照图1所讨论的,该第一解码模块104将M个输入音频信号322解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号326。如该示例中所示出的,该M个声道可以对应于中心前置扬声器⑹、左前扬声器L、右前扬声器⑻、左环绕扬声器LS、右环绕扬声器RS、左天花板扬声器LT、以及右天花板扬声器RT。第一解码模块104还将另外的音频信号321解码为输出音频信号325,该输出音频信号325通常对应于低频效果LFE扬声器。[0138]如以上参照图1进一步讨论的,另外的输入音频信号324中的每一个对应于中间信号326中的一个,因为它是与该中间信号对应的侧边信号或者与该中间信号对应的补充信号。举例来说,输入音频信号324中的第一个可以对应于与左前扬声器相关联的中间信号326,输入音频信号324中的第二个可以对应于与右前扬声器等相关联的中间信号326。[0139]M个中间信号326和N-M个音频输入音频信号324被输入到第二解码模块106,该第二解码模块106产生适合于在N声道扬声器配置上回放的N个音频信号328。[0140]第二解码模块106将中间信号326中的不具有对应的残余信号的那些中间信号映射到N声道扬声器配置的对应声道,可选地经由高频重构组件308。例如,与M声道扬声器配置的中心前置扬声器0:对应的中间信号可以被映射到N声道扬声器配置的中心前置扬声器C。高频重构组件308类似于稍后将参照图4和5描述的那些。[0141]第二解码模块106包括N-M个立体声解码模块306,由中间信号326和对应的输入音频信号324构成的每一对一个立体声解码模块306。一般地,每个立体声解码模块306执行联合立体声解码以产生立体声音频信号,该立体声音频信号映射到N声道扬声器配置的声道中的两个。举例来说,将与7声道扬声器配置的左前扬声器L对应的中间信号及其对应的输入音频信号324当作输入的立体声解码模块306产生立体声音频信号,该立体声音频信号映射到13声道扬声器配置的两个左前扬声器(“Lwide”和“Lscreen”)。[0142]立体声解码模块306可在依赖于编码器解码器系统按其操作的数据传输率比特率)(即,解码器300按其接收数据的比特率的至少两个配置中操作。第一配置可以例如对应于中等比特率,诸如每立体声解码模块306大约32-48kbps。第二配置可以例如对应于高比特率,诸如每立体声解码模块306超过48kbps的比特率。解码器300接收关于使用哪个配置的指示。例如,这样的指示可以通过编码器经由数据流320中的一个或多个比特用信号通知给解码器300。[0143]图4示出当立体声解码模块306根据与中等比特率对应的第一配置工作时的立体声解码模块3〇6。该立体声解码模块306包括立体声转换组件440、各种时间频率变换组件442、4妨、454,高频重构HFR组件448、以及立体声上混组件452。立体声解码模块306被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域通常为修正离散余弦变换MDCT域中被表示。[0144]为了实现中等比特率,至少输入音频信号3¾的带宽被限制。更确切地说,输入音频信号324是包括与直到第一频率1^的频率对应的谱数据的波形编码信号。中间信号326是包括与直到比第一频率匕大的频率的频率对应的谱数据的波形编码信号。在一些情况下,为了节省必须在数据流320中被发送的更多比特,中间信号326的带宽也被限制,使得中间信号326包括直到比第一频率h大的第二频率k2的谱数据。[0145]立体声转换组件440将输入信号326、324变换为中间侧边表示。如以上进一步讨论的,中间信号326和对应的输入音频信号324可以以中间侧边形式或者中间补充a形式表示。在前一种情况下,由于输入信号已经为中间侧边形式,所以立体声转换组件440从而使输入信号326、324通过而没有任何修改。在后一种情况下,立体声转换组件440使中间信号326通过,而作为补充信号的输入音频信号324被变换为对于直到第一频率h的频率的侧边信号。更确切地说,立体声转换组件440通过将中间信号326与加权参数a其从数据流32〇接收相乘并将乘法的结果与输入音频信号324相加来确定对于直到第一频率1^的频率的侧边信号。作为结果,立体声转换组件从而输出中间信号326和对应的侧边信号424。[0146]关于这一点,值得注意的是,在中间信号326和输入音频信号犯4被以中间侧边形式接收的情况下,在立体声转换组件440中没有信号似4、326的混合发生。结果,中间信号326和输入音频信号324可以借助于具有不同变换大小的MDCT变换而被编码。然而,在中间信号326和输入音频信号324被以中间补充a形式接收的情况下,中间信号326和输入音频信号324的MDCT编码限于相同的变换大小。[0147]在中间信号326具有有限带宽的情况下(S卩,如果中间信号326的谱内容spectralcontent限于直到第二频率k2的频率),该中间信号326通过高频重构组件448经受高频重构HFR。通过HFR—般意指参数化技术,该参数化技术基于信号的低频在该情况下为低于第二频率k2的频率)的谱内容和在数据流320中从编码器接收的参数,重构该信号的高频在该情况下为高于第二频率k2的频率的谱内容。这样的高频重构技术在本领域中是已知的,并且包括例如谱带复制SBR技术。HFR组件4你从而将输出具有直到系统中所表示的最大频率的谱内容的中间信号426,其中,高于第二频率k2的谱内容被参数化重构。[0148]高频重构组件448通常在正交镜像滤波器QMF域中操作。因此,在执行高频重构之前,中间信号326和对应的侧边信号424可以首先通过通常执行逆向MDCT变换的时间频率变换组件442被变换到时域,并然后通过时间频率变换组件446被变换到QMF域。[0149]中间信号426和侧边信号424然后被输入到立体声上混组件452,该立体声上混组件452产生以LR形式表示的立体声信号428。由于侧边信号424仅具有对于直到第一频率h的频率的谱内容,所以立体声上混组件452不同地对待低于和高于第一频率1^的频率。[0150]更详细地,对于直到第一频率h的频率,立体声上混组件452将中间信号426和侧边信号424从中间侧边形式变换为LR形式。换句话说,立体声上混组件对于直到第一频率ki的频率执行逆向的和差变换。[0151]对于高于第一频率h的频率在这些频率处,没有谱数据提供给侧边信号424,立体声上混组件4f52从中间信号426参数化重构立体声信号428的第一分量和第二分量。一般地,立体声上混组件452经由数据流320接收在编码器侧出于这个目的而已被提取的参数,并使用这些参数以进行重构。一般地,可以使用任何己知的用于参数化立体声重构的技术。[0152]鉴于以上,由立体声上混组件452输出的立体声信号428从而具有直到系统中所表示的最大频率的谱内容,其中,高于第一频率ki的谱内容被参数化重构。类似于HFR组件448,立体声上混组件452通常在QMF域中操作。因此,立体声信号428通过时间频率变换组件454被变换到时域,以便产生在时域中表示的立体声信号328。[0153]图5示出当立体声解码模块306根据与高比特率对应的第二配置操作时的立体声解码模块306。该立体声解码模块306包括第一立体声转换组件540、各种时间频率变换组件542、546、554,第二立体声转换组件452、以及高频重构耶幻组件548、5481。立体声解码模块3〇6被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域通常为修正离散余弦变换MDCT±或中被表示。[0154]在高比特率情况下,关于输入信号326、3料的带宽的限制不同于中等比特率情况。更确切地说,中间信号3洲和输入音频信号3M是包括与直到第二频率k2的频率对应的谱数据的波形编码信号。在一些情况下,第二频率k2可以对应于系统所表示的最大频率。在其它情况下,第二频率k2可以低于系统所表示的最大频率。[0155]中间信号326和输入音频信号324被输入到第一立体声转换组件540以供变换为中间侧边表示。该第一立体声转换组件540类似于图4的立体声转换组件440。不同之处在于,在输入音频信号324为补充信号的形式的情况下,第一立体声转换组件540将补充信号变换为对于直到第二频率k2的频率的侧边信号。因此,立体声转换组件540输出中间信号326和对应的侧边信号524,这两个信号都具有直到第二频率的谱内容。[0156]中间信号326和对应的侧边信号524然后被输入到第二立体声转换组件552。该第二立体声转换组件552形成中间信号326和侧边信号524的和与差,以便将中间信号326和侧边信号524从中间侧边形式变换为LR形式。换句话说,第二立体声转换组件执行逆向的和与差变换,以便产生具有第一分量528a和第二分量528b的立体声信号。[0157]优选地,第二立体声转换组件552在时域中操作。因此,在被输入到第二立体声转换组件552之前,中间信号326和侧边信号524可以通过时间频率变换组件542被从频域MDCT域变换到时域。作为替代方案,第二立体声转换组件552可以在QMF域中操作。在这样的情况下,图5的组件546和552的次序将被反过来。这是有利的,因为在第二立体声转换组件552中发生的混合将不对关于中间信号326和输入音频信号324的MDCT变换大小施加任何进一步的限制。因此,如以上进一步讨论的,在中间信号326和输入音频信号324被以中间侧边形式接收的情况下,它们可以借助于使用不同变换大小的MDCT变换而被编码。[0158]在第二频率k2低于所表示的最高频率的情况下,立体声信号的第一和第二分量528a、528b可以通过高频重构组件548a、548b经受高频重构HFR。该高频重构组件548a、548b类似于图4的高频重构组件448。然而,在该情况下,值得注意的是,第一组高频重构参数经由数据流230被接收,并且在立体声信号的第一分量528a的高频重构中被使用,以及第二组高频重构参数经由数据流230被接收,并且在立体声信号的第二分量528b的高频重构中被使用。因此,高频重构组件548a、548b输出包括直到系统中所表示的最大频率的谱数据的立体声信号的第一和第二分量530a、530b,其中,高于第二频率k2的谱内容被参数化重构。[0159]优选地,高频重构在QMF域中执行。因此,在经受高频重构之前,立体声信号的第一和第二分量528a、528b可以通过时间频率变换组件546被变换到[0160]从高频重构组件548输出的立体声信号的第一和第二分量530a、530b然后可以通过时间频率变换组件554被变换到时域,以便产生在时域中表示的立体声信号328。[0161]图6示出被配置用于包括在数据流620中的多个输入音频信号的解码以供在具有11.1声道的扬声器配置上回放的解码器600。该解码器600的结构总体上类似于图3中所示出的结构。不同之处在于,示出的扬声器配置的声道数量与图3相比较少,在图3中,示出了具有13.1声道的扬声器配置,其具有LFE扬声器、三个前置扬声器(中心C、左L和右R、四个环绕扬声器(左侧Lside、左后Lback、右侧Rside、右后Rback、以及四个天花板扬声器(左上前置LTF、左上后置LTB、右上前置RTF、和右上后置RTB。[0162]在图6中,第一解码组件104输出七个中间信号626,这些信号可以对应于扬声器配置的声道:丄、1?、1^、1«儿1'和1^。而且,存在四个另外的输入音频信号6243-1。该另外的输入音频信号624a-d每一个对应于中间信号626中的一个。举例来说,输入音频信号624a可以是与LS中间信号对应的侧边信号或补充信号,输入音频信号624b可以是与RS中间信号对应的侧边信号或补充信号,输入音频信号624c可以是与LT中间信号对应的侧边信号或补充信号,并且输入音频信号624d可以是与RT中间信号对应的侧边信号或补充信号。[0163]在示出的实施例中,第二解码模块106包括图4和图5中所示出的类型的四个立体声解码模块306。每个立体声解码模块306将中间信号626中的一个和对应的另外的输入音频信号624a-d当作输入,并且输出立体声音频信号328。例如,基于LS中间信号和输入音频信号624a,第二解码模块106可以输出与Lside和Lback扬声器对应的立体声信号。更多的示例从该图是显然的。[0164]此外,第二解码模块1〇6充当中间信号626中的三个这里,与C、L和R声道对应的中间信号)的传递通道passthrough。依赖于这些信号的谱带宽,第二解码模块106可以通过使用高频重构组件308来执行高频重构。[0165]图7示出旧有或低复杂度的解码器700如何对与具有K个声道的扬声器配置对应的数据流720的多声道音频内容进行解码以供在具有M个声道的扬声器配置上回放。举例来说,K可以等于十一或十三,而M可以等于七。该解码器700包括接收组件702、第一解码模块704、以及高频重构模块712。[0166]如参照图1中的数据流120进一步描述的,数据流720—般可以包括M个输入音频信号722参见图1和图3中的信号122和322和K-M个另外的输入音频信号参见图1和图3中的信号124和324。可选地,数据流720可以包括另外的音频信号721,该另外的音频信号721通常对应于LFE声道。由于解码器700对应于具有M个声道的扬声器配置,所以接收组件702从数据流72〇仅提取M个输入音频信号722和另外的音频信号721,如果存在的话),并且丢弃剩余的K-M个另外的输入音频信号。[0167]这里通过七个音频信号示出的M个输入音频信号722和另外的音频信号721然后被输入到第一解码模块104,该第一解码模块104将M个输入音频信号722解码为与M声道扬声器配置的声道对应的M个中间信号726。[0168]在M个中间信号726仅包括直到低于系统所表示的最大频率的某一频率的谱内容的情况下,借助于高频重构模块712可以使M个中间信号726经受高频重构。[0169]图8示出这样的高频重构模块712的示例。高频重构模块712包括高频重构组件848和各种时间频率变换组件842、846、854。[0170]借助于HFR组件848使输入到HFR模块712的中间信号726经受高频重构。该高频重构优选地在QMF域中执行。因此,通常为MDCT谱的形式的中间信号726在被输入到HFR组件848之前,可以通过时间频率变换组件842被变换到时域,并然后通过时间频率变换组件846被变换到QMF域。[0171]HFR组件848—般以与例如图4和图5的HFR组件448、548相同的方式操作,因为它使用输入信号的较低频的谱内容连同从数据流720接收的参数,以便参数化重构较高频的谱内容。然而,依赖于编码器解码器系统的比特率,HFR组件848可以使用不同的参数。[0172]如参照图5所解释的,对于高比特率情况以及对于具有对应的另外的输入音频信号的每个中间信号,数据流720包括第一组IFR参数和第二组HFR参数(参见图5的项548a、548b的描述)。即使解码器700不使用与中间信号对应的另外的输入音频信号,HFR组件848在执行中间信号的高频重构时也可以使用第一组HFR参数和第二组fFR参数的组合。例如,高频重构组件848可以使用第一组和第二组的HFR参数的下混诸如平均或线性组合)。[0173]HFR组件854从而输出具有扩展的谱内容的中间信号828。该中间信号828然后借助于时间频率变换组件854被变换到时域,以便给出具有时域表示的输出信号728。[0174]下面将参照图9-11来描述编码器的示例实施例。[0175]图9示出被归入图2的一般结构的编码器900。该编码器900包括接收组件(未示出)、第一编码模块206、第二编码模块204、以及量化和复用组件902。第一编码模块206还可以包括高频重构HFR编码组件908和立体声编码模块906。编码器900可以还包括立体声转换组件910。[0176]现在将解释编码器900的操作。接收组件接收与具有K个声道的扬声器配置的声道对应的K个输入音频信号928。例如,K个声道可以对应于如上所述的13声道配置的声道。此外,通常与LFE声道对应的另外的声道925可以被接收。K个声道被输入到第一编码模块206,该第一编码模块206产生M个中间信号926和K-M个输出音频信号924。[0177]第一编码模块206包括K-M个立体声编码模块906。该K-M个立体声编码模块906中的每一个将K个输入音频信号中的两个当作输入,并且产生中间信号926中的一个和输出音频信号924中的一个,如下面将更详细地解释的。[0178]第一编码模块2〇6还将没有被输入到立体声编码模块906中的一个的剩余的输入音频信号映射到M个中间信号926中的一个,可选地经由HFR编码组件908。该HFR编码组件908类似于将参照图10和图11描述的那些。[0179]M个中间信号926,可选地连同通常表示LFE声道的另外的输入音频信号925—起,被输入到如以上参照图2描述的第二编码模块2〇4以编码为M个输出音频声道922。[0180]在被包括在数据流920中之前,K-M个输出音频信号似4可选地可以借助于立体声转换组件91〇被成对地编码。例如,立体声转换组件91〇可以通过执行MS或增强的MS编码来对K-M个输出音频信号924中的一对进行编码。[0181]M个输出音频信号似2以及从另外的输入音频信号925得到的另外的信号)和K-M个输出音频信号924或者从立体声编码组件910输出的音频信号通过量化和复用组件902被量化并包括在数据流92〇中。而且,由不同的编码组件和模块提取的参数可以被量化并包括在数据流中。[0182]立体声编码模块906可在依赖于编码器解码器系统按其操作的数据传输率比特率)(即,编码器900按其传输数据的比特率的至少两个配置中操作。第一配置可以例如对应于中等比特率。第二配置可以例如对应于高比特率。编码器900将关于使用哪个配置的指示包括在数据流920中。例如,这样的指示可以经由数据流920中的一个或多个比特而被用信号通知。[0183]图10示出当立体声编码模块906根据与中等比特率对应的第一配置操作时的立体声编码模块906。该立体声编码模块906包括第一立体声转换组件1040、各种时间频率变换组件1042、1046,HFR编码组件1048、参数化立体声编码组件1052、以及波形编码组件1056。立体声编码模块906还可以包括第二立体声转换组件1043。该立体声编码模块906将输入音频信号928中的两个当作输入。假定输入音频信号928在时域中被表示。[0184]第一立体声转换组件1040通过根据以上形成和与差来将输入音频信号928变换为中间侧边表示。因此,第一立体声转换组件940输出中间信号1026和侧边信号1024。[0185]在一些实施例中,中间信号1026和侧边信号1024然后通过第二立体声转换组件1043被变换为中间补充a表示。第二立体声转换组件1043提取加权参数a以用于包括在数据流920中。加权参数a可以是时间和频率相关的,S卩,它可以在数据的不同时间帧和频带之间变化。[0186]波形编码组件1056使中间信号1026和侧边或补充信号经受波形编码,以便产生波形编码的中间信号926和波形编码的侧边或补充信号924。[0187]第二立体声转换组件1043和波形编码组件1056通常在MDCT域中操作。因此,中间信号1026和侧边信号1024可以在第二立体声转换和波形编码之前借助于时间频率变换组件1042被变换到MDCT域。在信号1026和1024不经受第二立体声转换1043的情况下,不同的MDCT变换大小可以被用于中间信号1026和侧边信号1024。在信号1026和1024经受第二立体声转换1043的情况下,相同的MDCT变换大小应当被用于中间信号1026和补充信号1024。[0188]为了实现中等比特率,至少侧边或补充信号924的带宽被限制。更确切地说,侧边或补充信号被针对直到第一频率ki的频率进行波形编码。因此,波形编码的侧边或补充信号924包括与直到第一频率h的频率对应的谱数据。中间信号1026被针对直到比第一频率匕大的频率的频率进行波形编码。因此,中间信号926包括与直到比第一频率lu大的频率的频率对应的谱数据。在一些情况下,为了节省必须在数据流920中被发送的更多比特,中间信号926的带宽也被限制,使得波形编码的中间信号926包括直到比第一频率ki大的第二频率h的谱数据。[0189]在中间信号926的带宽被限制的情况下(S卩,如果中间信号926的谱内容限于直到第二频率k2的频率),中间信号1026通过HFR编码组件1048经受HFR编码。一般地,HFR编码组件1048对中间信号1026的谱内容进行分析并提取一组参数1060,该组参数1060使得能够基于信号的低频在该情况下为高于第二频率1«的频率的谱内容来重构信号的高频在该情况下为高于第二频率k2的频率)的谱内容。这样的HFR编码技术在本领域中是已知的,并且包括例如谱带复制SBR技术。该组参数1060被包括在数据流920中。[0190]HFR编码组件1048通常在正交镜像滤波器QMF域中操作。因此,在执行HFR编码之前,中间信号326可以通过时间频率变换组件1046被变换到QMF域。[0191]输入音频信号928或者可替代地,中间信号1046和侧边信号1024在参数化立体声PS编码组件1052中经受参数化立体声编码。一般地,参数化立体声编码组件1052对输入音频信号928进行分析并提取参数1062,该参数1062使得能够基于对于高于第一频率b的频率的中间信号1026来重构输入音频信号928。参数化立体声编码组件1052可以应用任何已知的用于参数化立体声编码的技术。参数1062被包括在数据流920中。[0192]参数化立体声编码组件1052通常在QMF域中操作。因此,输入音频信号928或者可替代地,中间信号1046和侧边信号1024可以通过时间频率变换组件1046被变换到QMF域。[0193]图11示出当立体声编码模块906根据与高比特率对应的第二配置操作时的立体声编码模块906。该立体声编码模块906包括第一立体声转换组件1140、各种时间频率变换组件1142、1146,HFR编码组件1048a、1048b、以及波形编码组件1156。可选地,立体声编码模块9〇6可以包括第二立体声转换组件1143。该立体声编码模块906将输入音频信号928中的两个当作输入。假定输入音频信号928在时域中被表示。[0194]第一立体声转换组件1140类似于第一立体声转换组件1040,并且将输入音频信号928变换为中间信号1126和侧边信号1124。[0195]在一些实施例中,中间信号1126和侧边信号1124然后通过第二立体声转换组件1143被变换为中间补充a表示。第二立体声转换组件1043提取加权参数a以用于包括在数据流920中。加权参数a可以是时间和频率相关的,g卩,它可以在数据的不同时间帧和频带之间变化。波形编码组件1156然后使中间信号1126和侧边或补充信号经受波形编码,以便产生波形编码的中间信号926和波形编码的侧边或补充信号924。[0196]波形编码组件1156类似于图10的波形编码组件1056。然而,关于输出信号926、924的带宽出现重要的不同。更确切地说,波形编码组件1156执行中间信号1126和侧边或补充信号的直到第二频率k2其通常大于关于中间比特率情况描述的第一频率k〇的波形编码。作为结果,波形编码的中间信号926和波形编码的侧边或补充信号924包括与直到第二频率k2的频率对应的谱数据。在一些情况下,第二频率k2可以对应于系统所表示的最大频率。在其它情况下,第二频率k2可以低于系统所表示的最大频率。[0197]在第二频率k2低于系统所表示的最大频率的情况下,输入音频信号928通过HFR组件114池、114¾经受HFR编码。HFR编码组件1148a、114¾中的每一个与图1〇的HFR编码组件1048类似地操作。因此,HFR编码组件1148a、1148b分别产生第一组参数1160a和第二组参数1160b,这些参数使得能够基于输入音频信号犯8的低频在该情况下为高于第二频率匕的频率)的谱内容来重构各个输入音频信号928的高频(在该情况下为高于第二频率k2的频率的谱内容。第一组和第二组参数1160a、1160b被包括在数据流920中。[0198]等同、扩展、替代和其它[0199]在研宄以上描述之后,本公开的进一步的实施例对于本领域技术人员将变得清楚。即使目前的描述和附图公开了实施例和示例,但本公开也不限于这些具体示例。在不脱离由随附权利要求限定的本公开的范围的情况下,可以进行许多修改和变型。在权利要求中出现的任何附图标记都不应被理解为限制它们的范围。[0200]另外,对公开的实施例的变型可以由技术人员在实施本公开时从附图、公开和所附权利要求的研究来理解和实现。在权利要求中,词语“包括”不排除其它元件或步骤,并且不定冠词“一个”不排除多个。仅有的某些措施在相互不同的独立权利要求中被记载的事实并不表明这些措施的组合不能被用于获利。[0201]在上文中公开的系统和方法可以被实现为软件、固件、硬件或其组合。在硬件实现中,在以上描述中提及的功能单元之间的任务的划分不一定对应于划分成物理单元;相反,一个物理组件可以具有多个功能,并且一个任务可以由若干物理组件合作执行。某些组件或全部组件可以被实现为由数字信号处理器或微处理器执行的软件,或者被实现为硬件或专用集成电路。这样的软件可以分发在计算机可读介质上,该计算机可读介质可以包括计算机存储介质或非暂时性介质和通信介质或暂时性介质)。如本领域技术人员公知的,术语计算机存储介质包括以存储信息诸如计算机可读指令、数据结构、程序模块或其它数据的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质两者。计算机存储介质包括但不限于1^1!、如1^3£?如1!、闪速存储器或其它存储器技术、00-1?撕、数字多功能盘DVD或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储设备、或者可以被用于存储期望信息并且可以被计算机访问的任何其它介质。此外,技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块、或调制数据信号诸如载波或其它输送机制)中的其它数据,并且包括任何信息递送介质。[0202]所有的附图都是示意性的,并且一般仅示出了为了阐明本公开而必要的部分,而其它部分则可以被省略或者仅仅被建议。除非另外指出,否则同样的附图标记在不同的附图中指代同样的部分。

权利要求:1.一种用于对编码的音频信号进行解码的方法,所述方法包括:接收多个输入音频信号,所述多个输入音频信号包括第一波形编码信号和第二波形编码信号,所述第一波形编码信号包括与直到第一频率的频率对应的谱数据,所述第二波形编码信号包括与直到第二频率的频率对应的谱数据,所述第二频率高于所述第一频率;对所述第一波形编码信号进行解码以产生第一解码音频信号,所述第一解码音频信号具有直到所述第一频率的频率,所述第一解码音频信号表示侧边信号;对所述第二波形编码信号进行解码以产生第二解码音频信号,所述第二解码音频信号具有直到所述第二频率的频率,所述第二解码音频信号表示中间信号;对所述第一解码信号和第二解码信号执行增强的逆向的和差变换以产生直到所述第一频率的立体声音频信号,其中,所述增强的逆向的和差变换包括向所述中间信号应用加权参数;对所述第二解码信号执行逆向的和差变换以产生直到所述第二频率的立体声音频信号;以及将具有直到所述第一频率的频率的立体声音频信号与具有直到所述第二频率的频率的立体声音频信号进行组合。2.根据权利要求1所述的方法,其中,所述加权参数是时间变量。3.根据权利要求1所述的方法,其中,所述增强的逆向的和差变换根据L=1+aA+B产生左声道L,其中,a是加权参数,A是中间信号,B是侧边信号。4.根据权利要求1所述的方法,其中,所述增强的逆向的和差变换根据R=1-aA-B产生右声道R,其中,a是加权参数,A是中间信号,B是侧边信号。5.根据权利要求1所述的方法,其中,所述加权参数是实值。6.根据权利要求1所述的方法,其中,所述加权参数被包括在编码音频信号中。7.—种用于对编码的音频信号进行解码的音频解码器,所述音频解码器包括:接收多个输入音频信号的接口,所述多个输入音频信号包括第一波形编码信号和第二波形编码信号,所述第一波形编码信号包括与直到第一频率的频率对应的谱数据,所述第二波形编码信号包括与直到第二频率的频率对应的谱数据,所述第二频率高于所述第一频率;对所述第一波形编码信号进行解码以产生第一解码音频信号的解码器,所述第一解码音频信号具有直到所述第一频率的频率,所述第一解码音频信号表示侧边信号;对所述第二波形编码信号进行解码以产生第二解码音频信号的解码器,所述第二解码音频信号具有直到所述第二频率的频率,所述第二解码音频信号表示中间信号;对所述第一解码信号和第二解码信号执行增强的逆向的和差变换以产生直到所述第一频率的立体声音频信号的变换器,其中,所述增强的逆向的和差变换包括向所述中间信号应用加权参数;对所述第二解码信号执行逆向的和差变换以产生直到所述第二频率的立体声音频信号的变换器;以及将具有直到所述第一频率的频率的立体声音频信号与具有直到所述第二频率的频率的立体声音频信号进行组合的合成器。8.根据权利要求7所述的音频解码器,其中,所述加权参数是时间变量。9.根据权利要求7所述的音频解码器,其中,所述增强的逆向的和差变换根据L=l+aA+B产生左声道L,其中,a是加权参数,A是中间信号,B是侧边信号。10.根据权利要求7所述的音频解码器,其中,所述增强的逆向的和差变换根据R=l_aA-B产生右声道R,其中,a是加权参数,A是中间信号,B是侧边信号。11.根据权利要求7所述的音频解码器,其中,所述加权参数是实值。12.讎WJ魏7臟齡讎離,其巾,臟加畅!嫩包雛编码音频信号中。

百度查询: 杜比国际公司 多声道音频内容的编码

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。