买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】根据用户肢体运动的视频渲染方法和装置_北京微播视界科技有限公司_201810327082.9 

申请/专利权人:北京微播视界科技有限公司

申请日:2018-04-12

公开(公告)日:2020-01-10

公开(公告)号:CN108537867B

主分类号:G06T15/00(20110101)

分类号:G06T15/00(20110101);G06T13/40(20110101)

优先权:

专利状态码:有效-授权

法律状态:2020.01.10#授权;2018.10.16#实质审查的生效;2018.09.14#公开

摘要:本发明提出了一种根据用户肢体运动的视频渲染方法和装置,其中,方法包括:确定渲染模板;根据所拍摄视频帧中的用户动作确定肢体关键点;对肢体关键点进行转换处理生成渲染坐标;根据渲染模板和渲染坐标对肢体关键点进行渲染处理并显示。由此,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。

主权项:1.一种根据用户肢体运动的视频渲染方法,其特征在于,包括以下步骤:确定渲染模板,所述渲染模板包括动态渲染图,和,渲染时间、渲染角度、渲染大小、渲染颜色、渲染模式中的一种或者多种参数组合;采集用户的生理数据,根据所述生理数据快速定位出用户在所拍摄的视频帧中的画面区域;根据所述画面区域中的用户动作确定所述拍摄视频帧中的肢体关键点;对所述肢体关键点进行转换处理生成所述拍摄视频帧中的渲染坐标,其中,所述渲染坐标和所述肢体关键点之间具有坐标偏移量;根据所述渲染模板和所述渲染坐标对所述肢体关键点进行渲染处理并显示。

全文数据:根据用户肢体运动的视频渲染方法和装置技术领域[0001]本发明涉及视频处理技术领域,尤其涉及一种根据用户肢体运动的视频渲染方法和装置。背景技术[0002]随着4G普及,网络环境和流量资费的发展,短视频应用的多媒体内容传播方式迅速发展。其中,短视频即短片视频,一般是在互联网新媒体上传播的时长在5分钟以内的视频传播内容,随着移动终端普及和网络的提速,短平快的大流量传播内容逐渐获得各大平台的推广和用户关注。[0003]相关技术中,当短视频用户需要拍摄视频时,通过拍摄视频功能选择自己喜欢的风格和首乐,然后开始拍摄并进行视频编辑,最后可以发布或者是保存短视频。其中,为了提升丰富拍摄用户的拍摄效果,可以根据用户需求对拍摄用户进行美颜处理,比如滤镜、磨皮等效果;或者,在拍摄中为用户增加丰富的魔法自拍表情和背景选择,比如卡通头像等,提升了拍摄的多样性和趣味性。[0004]然而,针对现有技术的短视频拍摄过程,主要是根据用户需求对拍摄用户的面部进行美颜处理,或者,是根据预先设置的魔法表情模板对用户面部进行定位添加,因此,特效处理的表现形式只在于拍摄用户面部,具有一定的局限性。发明内容[0005]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。[0006]为$,本发明的第一个目的在于提出一种根据用户肢体运动的视频渲染方法,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。[0007]本发明的第二个目的在于提出一种根据用户肢体运动的视频渲染装置。[0008]本发明的第三个目的在于提出一种计算机程序产品。[0009]本发明的第四个目的在于提出一种非临时性计算机可读存储介质。[0010]本发明的第五个目的在于提出一种终端设备。[0011]为达上述目的,本发明第一方面实施例提出了一种根据用户肢体运动的视频渲染方法,包括以下步骤:确定渲染模板;根据所拍摄视频帧中的用户动作确定肢体关键点;对所述肢体关键点进行转换处理生成渲染坐标;根据所述渲染模板和所述渲染坐标对所述肢体关键点进行渲染处理并显示。[0012]本发明实施例的根据用户肢体运动的视频渲染方法,确定渲染模板并根据所拍摄视频帧中的用户动作确定肢体关键点,进而,对肢体关键点进行转换处理生成渲染坐标,最终,根据渲染模板对拍摄视频帧的肢体关键点进行渲染处理并显示。由此,实现了渲染效果跟随用户的肢体动作显示的效果,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。[0013]为达上述目的,本发明第二方面实施例提出了一种根据用户肢体运动的视频渲染装置,包括:确定模块,确定渲染模板;生成模块,用于对所述肢体关键点进行转换处理生成渲染坐标;处理模块,根据所述渲染模板和所述渲染坐标对所述肢体关键点进行渲染处理并显不。[0014]本发明实施例的根据用户肢体运动的视频渲染装置,确定渲染模板并根据所拍摄视频帧中的用户动作确定肢体关键点,进而,对肢体关键点进行转换处理生成渲染坐标,最终,根据渲染模板对拍摄视频帧的肢体关键点进行渲染处理并显示。由此,实现了渲染效果跟随用户的肢体动作显示的效果,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。[0015]为达上述目的,本发明第三方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如上述实施例描述的根据用户肢体运动的视频渲染方法。[0016]为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,该程序被处理器执行时实现如上述实施例描述的根据用户肢体运动的视频渲染方法。[0017]为了实现上述目的,本发明第五方面实施例提出了一种终端设备,包括本发明第二方面实施例所述的根据用户肢体运动的视频渲染装置。[0018]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明[0019]本发明上述的和或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:[0020]图1是根据本发明一个实施例的根据用户肢体运动的视频渲染方法的流程图;[0021]图2是根据本发明另一个实施例的根据用户肢体运动的视频渲染方法的流程图;[0022]图3是根据本发明一个实施例的根据用户肢体运动的视频渲染方法的应用场景示意图;[0023]图4是根据本发明一个实施例的目标跟踪算法的原理示意图;[0024]图5是根据本发明又一个实施例的根据用户肢体运动的视频渲染方法的流程图;[0025]图6是根据本发明再一个实施例的根据用户肢体运动的视频渲染方法的流程图;[0026]图7是根据本发明另一个实施例的根据用户肢体运动的视频渲染方法的应用场景不意图;[0027]图8是根据本发明又—个实施例的根据用户肢体运动的视频渲染方法的应用场景示意图;[0028]图9是根据本发明一个实施例的根据用户肢体运动的视频渲染装置的结构示意图;[0029]图10是根据本发明另一个实施例的根据用户肢体运动的视频渲染装置的结构示胃S;[0030]图11是根据本发明又一个实施例的根据用户肢体运动的视频渲染装置的结构示意图;[0031]图12是根据本发明再一个实施例的根据用户肢体运动的视频渲染装置的结构示意图;[0032]图13是根据本发明还一个实施例的根据用户肢体运动的视频渲染装置的结构示意图;[0033]图14是根据本发明还另一个实施例的根据用户肢体运动的视频渲染装置的结构不意图;[0034]图15为实现本发明实施方式的示例性计算机设备的框图;[0035]图16是根据本发明一个实施例的计算机可读存储介质的示意图;以及[0036]图17是根据本发明一个实施例的终端设备的结构示意图。具体实施方式[0037]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。[0038]下面参考附图描述本发明实施例的根据用户肢体运动的视频渲染方法和装置。[0039]图1是根据本发明一个实施例的根据用户肢体运动的视频渲染方法的流程图,如图1所示,该根据用户肢体运动的视频渲染方法包括:[0040]步骤101,确定渲染模板。[0041]步骤1〇2,根据所拍摄视频帧中的用户动作确定肢体关键点。其中,肢体关键点包括用户的骨骼的关节位置点、身体部位位置点,比如,包括胳膊肘关节的位置点、手指关节位置点,手的位置等,通过肢体关键点可以定位出用户当前的肢体位置,比如通过定位多个拍摄的视频帧中用户的肢体关键点,可以检测出用户在进行双手画圈动作时的具体画圈位置。[0042]具体地,在本发明的实施例中,以拍摄的视频帧为处理单位,检测所拍摄的视频中贞中的用户动作的肢体关键点,以便于对拍摄视频帧中的用户的动作进行显示相关处理。'[0043]需要说明的是,根据应用场景的不同,检测拍摄视频的拍摄视频帧,根据拍摄视频帧中的用户动作确定肢体关键点的方式,包括但不限于以下几种:[0044]第一种示例:[0045]在本示例中,如图2所示,步骤102包括:[0046]步骤201,根据肢体骨骼的运动变化建立骨骼三维数据。[0047]作为一种可能的实现方式,通过采用T0F技术测量深度来获取人体的深度信息,通过随机决策森林等算法对人体的各个部分进行不同的标记,最后从各个不同的标记中提取人体的肢体骨骼的运动变化,进而,根据肢体骨骼的运动变化建立骨骼的三维数据,其中,骨骼的三维数据包括用户每个肢体关键点的x、y、z轴的坐标信息。以’[0048]作为另一种可能的实现方式,如图3左图所示,通过红外等传感器检测到用户的肢体骨骼,在检测到人体的肢体骨骼后,对肢体骨骼进行图像识别,从而,如图3右图所示,牛艮据用户动作识别出肢体关键点位置为手部部位,进而,根据运动传感器采集手部关键点、位置对应的三维数据作为骨骼三维数据。…[0049]步骤2〇2,根据骨骼三维数据和动态目标跟踪算法识别拍摄视频帧中的用户动作确定肢体关键点。[0050]其中,动态目标跟踪算法包括不依赖于先验知识,直接从视频帧中检测到肢体关键点,并进行肢体关键点识别,最终跟踪感兴趣的肢体关键点的算法,以及,依赖于目标的先验知识,首先为骨骼三维数据对应的肢体关键点建模,然后在拍摄视频帧中实时找到相匹配的肢体关键点的算法。[0051]作为一种可能的实现方式,可采用单目标跟踪算法实现对用户动作的识别,其中,单目标跟踪算法本质上是一个递推滤波的过程,首先可由图像识别等技术确定出用户的量测数据,比如,用户肢体的位置等,进而,通过预先训练的量测模型等确定量测数据与用户肢体的位置的关系函数,将关系函数与肢体的当前位置一起作为输入,由跟踪滤波器等结合预先训练的机动模型得到下一时刻的肢体位置点的预测位置,并把预测得到的预测位置作为下一时刻的初始肢体关键点的位置,从而实现对用户动作的跟踪,进而,根据肢体的位置以及骨骼三维数据,确定出对应拍摄视频帧中的肢体关键点。[0052]作为另一种可能的实现方式,结合均值漂移的目标跟踪算法进行肢体关键点的确定,首先,基于均值漂移的目标跟踪算法通过分别计算初始拍摄视频帧中用户动作所在的目标区域,和,当前拍摄视频帧内用户动作所在的候选区域内像素的特征值概率,得到关于目标模型和候选模型的描述,然后利用相似函数度量初始帧目标模型和当前帧的候选模版的相似性,选择使相似函数最大的候选模型并得到关于目标模型的均值向量,这个向量正是由指示用户动作的肢体由初始位置向正确位置移动的向量。由于均值漂移算法的快速收敛性,通过不断迭代计算均值向量,算法最终将收敛到目标的真实位置,达到跟踪的用户肢体目的,进而,根据跟踪的用户肢体,结合骨骼三维数据实现对用户肢体关键点的确定。[0053]下面通过图4所示直观的说明均值跟踪算法的基本原理。如下图所示:目标跟踪开始于数据点Xl°空心圆点xAxi1,…,XlN表示的是中心点,上标表示的是的迭代次数,周围的黑色圆点表示不断移动中的窗口样本点,虚线圆圈代表的是密度估计窗口的大小)。箭头表示样本点相对于核函数中心点的漂移向量,平均的漂移向量会指向样本点最密集的方向,也就是梯度方向。因为均值算法是收敛的,因此在当前帧中通过反复迭代搜索特征空间中样本点最密集的区域,搜索点沿着样本点密度增加的方向“漂移”到局部密度极大点点XiN,也就是被认为的目标位置用户肢体的位置),从而达到跟踪用户肢体的目的。第二种示例:[0054]在本示例中,如图5所示,步骤102包括:[0055]步骤301,根据边界轮廓算法确定拍摄视频帧的图案区域。[0056]其中,边界轮廓算法通过图像区域和其他非图像区域的边界像素的识别,区分出对应的图案区域的算法实现,根据应用场景的不同,边界轮廓算法可以通过不同的函数实现,作为一种可能的实现方式,边界轮廓算法为Candy函数,Canny函数基于拍摄视频帧中的两个阈值的提取进行边界轮廓的检测,其中,阈值是来确定哪里是边界轮廓位置。因此,基于Canny函数的执行代码,首先要设置两个阈值,其中,高的那个阈值是将要提取轮廓的用户肢体与背景区分开来,是决定目标与背景对比度的,低的那个阈值是用来平滑边缘的轮廓,有时高的阈值设置太大了,可能边缘轮廓不连续或者不够平滑,通过低阈值来平滑轮廓线,或者使不连续的部分连接起来,进而,基于设置的这两个阈值执行对应的代码实现边界轮廓的检测。[0057]步骤302,从图案区域中提取图案特征。[0058]步骤303,将图案特征与肢体关键点对应的样本图案特征进行匹配。[0059]步骤304,根据匹配结果确定拍摄频帧的肢体关键点。[0060]在本示例中,由于肢体关键点对应的图案特征与其他部位具有明显区别,比如,胳膊肘对应的图案特征与面部图像对应的特征具有明显区别等,从而可针对肢体关键点建立对应的样本图案特征,根据边界轮廓算法确定拍摄视频帧的图案区域后,从图案区域中提取图案特征,通过将图案特征与特征数据库中与肢体关键点对应的样本图案特征进行匹配,根据匹配结果确定拍摄视频帧的肢体关键点。[0061]第三种示例:[0062]在本示例中,抽取包含用户肢体图像的一帧拍摄视频帧显示给用户,由用户在显示的拍摄视频帧中选择并确定出标记肢体关键点,进而,通过跟踪算法和用户标记的标记肢体关键点确定出拍摄视频帧的肢体关键点。[0063]应当理解的是,由用户手动确定的肢体关键点可以由用户根据个人喜好设置,该肢体关键点可以是用户生理上的关键点,也可以是用户根据个人喜好自行设定的肢体的其他部位,比如用户的喉结位置等,从而,当用户设置肢体的其他部位时,可以根据进一步的视频显示处理提供更多的趣味显示效果,比如,用户的喉结喷火等趣味性视频显示处理。[0064]在实际执行过程中,为了便于进一步提高根据拍摄视频帧的用户动作确定肢体关键点的效率,避免拍摄视频帧中一些人像海报等人像图片导致的误判,还可在确定肢体关键点之前,采集用户的心跳数据、血压数据等生理数据以快速定位出用户所在画面区域,从而,仅仅识别用户所在画面区域,以提高识别效率。[0065]步骤103,对肢体关键点进行转换处理生成渲染坐标。[0066]具体地,为了精确的对用户的肢体动作进行相关显示处理,对拍摄视频帧的肢体关键点进行转换处理生成渲染坐标,以便于根据渲染坐标快速定位出用户的肢体位置。[0067]其中,对拍摄视频帧的肢体关键点进行转换处理生成渲染坐标的方式,根据应用场景的不同而不同。[0068]作为一种可能的实现方式,如图6所示,步骤103包括:[0069]步骤401,根据拍摄参数确定关键点容器模型。[0070]步骤402,根据关键点容器模型对肢体关键点进行转换处理,生成渲染坐标。[0071]由于用户在拍摄视频时,为了使得拍摄的效果更好,会调整拍摄的角度、拍摄距离等拍摄参数,而显然,拍摄参数不同,拍摄视频帧中用户的位置以及画面占比不同,从而,实现对用户的肢体渲染的渲染效果所在位置的确定方式不同,比如,当用户的位置在拍摄视频帧的中心位置以及画面占比较大时,则对应的渲染效果所在位置处理为相对较分散,又比如,当用户的位置在拍摄视频帧的角落区域且画面占比较小时,则对应的渲染效果所在位置处理为相对较集中,因而,在不同应用场景下的拍摄参数的不同直接影响对渲染效果位置的确定方式。[0072]在本发明的实施例中,通过关键点容器模型限制上述拍摄参数对渲染效果位置的确定方式,该关键点容器模型是根据大量实验数据训练得到的,该模型的输入为肢体关键点的位置,输出为渲染坐标,也就是说,通过关键点容器模型,可以实现肢体关键点位置到渲染坐标的转换,而不同的关键点容器模型的转换方式不同,以适应不同的拍摄参数,比如,关键点容器模型1的转换方式为将肢体关键点转换为较为集中的坐标点的转换相对肢体关键点的偏移量较小的转换方式),关键点容器模型2的转换方式为将肢体关键点转换为较为分散的坐标点的转换相对肢体关键点的偏移量较大的转换方式等,预先根据拍摄参数与渲染效果位置的确定方式的关系建立拍摄参数和关键点容器模型的对应关系,进而,根据拍摄参数确定对应的关键点容器模型,由此,根据关键点容器模型对拍摄视频帧的肢体关键点进行转换处理,生成渲染坐标,使得最后的渲染效果与用户的肢体关键点连接自然,渲染效果较好。[0073]作为另一种可能的实现方式,根据多个视频帧建立统一的坐标系,根据每个关键点在该坐标系的位置生成对应的渲染坐标。[0074]步骤104,根据渲染模板和渲染坐标对肢体关键点进行渲染处理并显示。[0075]其中,渲染模板是根据视频处理需求确定的,渲染模板包括火焰、流星、雨滴等特定图案的动态渲染图,或者,由多个渲染粒子组成的渲染3D动态渲染图,比如,多个火焰粒子组成的火焰动态渲染图等。[0076]渲染模板可包括对应的渲染参数对应,比如,对应的渲染参数包括渲染时间、渲染角度、渲染大小、渲染颜色、渲染模式中的一种或者多种参数组合。[0077]其中,渲染参数中的渲染时间决定了渲染模板对应的渲染效果的连续性,比如,渲染时间停留较长,则当前渲染效果会和上一时刻渲染效果在同一时间显示给用户,又比如,渲染时间停留效果较短,则仅仅会显示当前时间用户肢体关键点对应位置的显示效果;渲染参数中的渲染大小对应于渲染模板中对应渲染图案或者渲染粒子的大小的等;渲染参数中的渲染模板对应于渲染图案的显示方式,比如是旋转显示,渐渐清晰显示还是飞入显示等。[0078]在本发明的一个实施例中,确定渲染模板以及与渲染模板对应的渲染参数后,根据渲染参数和渲染坐标对拍摄视频帧的肢体关键点进行渲染处理后合成播放视频进行显示,其中,多个处理后的拍摄视频帧对应的视频流在播放时,形成了肢体关键点渲染处理后的效果。[0079]当然,在实际执行过程中,也可以实时对拍摄视频帧的肢体关键点进行渲染处理,不需要后期的合成即可同步展现肢体关键点渲染处理后的效果。[0080]需要说明的是,根据应用场景的不同,确定渲染模板中默认设置对应的渲染参数,为了提高渲染的灵活性,也可单独设置对应的渲染参数,其中,当单独设置对应的渲染参数时,设置与渲染模板对应的渲染参的方式不同,示例说明如下:[0081]第一种示例:[0082]在本示例中,预先设置渲染功能界面,显示预先设置的渲染功能界面,根据用户对渲染功能界面中的输入信息,确定渲染模板,其中,可以理解渲染摸中包含了默认渲染参数。[0083]在本示例中,当需要单数设置与渲染模板对应的渲染参数时,同样的,可以预先设置渲染功能界面,显示预先设置的渲染功能界面,根据用户对渲染功能界面中的输入信息,确定渲染模板和与渲染模板对应的渲染参数。[0084]需要说明的是,在本示例中,用户在渲染功能界面中的输入信息与渲染功能界面的界面功能设置相关,根据应用场景的不同,用户的输入信息可以为对对应渲染模板以及与渲染模板对应的渲染参数所在菜单的触发操作,或者,用户的输入信息可以为对应的渲染模板以及与渲染模板对应的渲染参数的标号的输入操作等。[0085]举例而言,如图7所示,在渲染功能界面上设置渲染模板以及对应的渲染参数,将检测到的用户触发的渲染模板以及对应的渲染参数,作为当前渲染模板以及与渲染模板对应的渲染参数。[0086]第二种不例:[0087]在本示例中,为了使得对视频的渲染效果与视频的合成更加自然,根据场景信息确定渲染模板-[0088]在本示例中,当需要单独设置渲染参数时,根据应用场景的场景信息确定渲染模板和与渲染模板对应的渲染参数,其中,场景信息包括当前用户的语音信息、动作信息、视频录制的环境信息等。[0089]具体地,在本示例中,获取拍摄视频的场景信息,根据场景信息确定渲染模板以及与渲染模板对应的渲染参数。[0090]举例而言,当场景信息为用户的语音信息时,如果获取到当前用户的语音信息为“和我一起去看流星雨”吧,则确定当前对应的渲染模板为包括流星雨渲染图的模板,对应的渲染参数可以是预先设置的与流星雨模板对应的渲染参数,也可以是通过学习用户的个人喜好后,自动匹配出的与流星雨模板对应的渲染参数等。[0091]由此,本发明实施例的根据用户肢体运动的视频渲染方法,通过定位出用户的肢体关键点进行渲染特效的添加,从而,实现了肢体运动跟踪渲染特效,提高了视频显示的趣味性,增加了用户和产品的粘性。[0092]为了使得本领域的技术人员,能够更加清楚本发明实施例的根据用户肢体运动的视频渲染方法,下面结合具体的应用场景进行说明:[0093]在本示例中,渲染模板为星形渲染图案,对应的渲染参数为渲染时间为5s等,如图8上图所示,假设当前视频流中的视频帧为1-5时,检测拍摄的每个视频帧中的用户动作,确定用户的动作的肢体关键点为手指位置(图8上图中的黑点指示位置),则对每个拍摄视频帧的手指关键点进行转换处理生成渲染坐标,进而,如图8中图所示,根据渲染坐标对每个视频帧的指指尖关键点进行星形渲染图案的渲染处理后合成播放视频,最终,生成的视频为如图8下图所示的星形渲染图案跟随用户手指画心的运动轨迹跟踪显示的效果。[0094]综上所述,本发明实施例的根据用户肢体运动的视频渲染方法,确定渲染模板并根据所拍摄视频巾贞中的用户动作确定肢体关键点,进而,对肢体关键点进行转换处理生成渲染坐标,最终,根据渲染模板对拍摄视频帧的肢体关键点进行渲染处理并显示。由此,实现了渲染效果跟随用户的肢体动作显示的效果,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。[0095]为了实现上述实施例,本发明还提出了一种根据用户肢体运动的视频渲染装置。[0096]图9是根据本发明一个实施例的根据用户肢体运动的视频渲染装置的结构示意图,如图9所示,该根据用户肢体运动的视频渲染装置包括:确定模块100、生成模块200和处理模块300。[0097]其中,确定模块100,用于检测确定渲染模板。[0098]生成模块200,用于对肢体关键点进行转换处理生成渲染坐标。[0099]在本发明的一个实施例中,如图10所示,生成模块2〇〇包括建立单元210和第一确定单元220,其中,[0100]建立单元210,用于根据肢体骨骼的运动变化建立骨骼三维数据。[0101]第一确定单元220,用于根据骨骼三维数据和动态目标跟踪算法识别拍摄视频帧中的用户动作确定肢体关键点。[0102]在本发明的一个实施例中,如图11所示,生成模块200包括第二确定单元230、提取单元240、匹配单元250和第三确定单元260。[0103]其中,第二确定单元230,用于根据边界轮廓算法确定拍摄视频帧的图案区域。[0104]提取单元240,用于从图案区域中提取图案特征。[0105]匹配单元250,用于将图案特征与肢体关键点对应的样本图案特征进行匹配。[0106]在本发明的一个实施例中,如图I2所示,生成模块200包括第四确定单元260和生成单元270,其中,[0107]第四确定单元270,用于根据拍摄参数确定关键点容器模型。[0108]生成单元280,用于根据所述关键点容器模型对肢体关键点进行转换处理,生成渲染坐标。[0109]在本发明的一个实施例中,如图I3所示,确定模100包括显示单元110和第五确定单元120,其中,[0110]显示单元110,用于显示预先设置的渲染功能界面。Com]第五确定单元12〇,用于根据用户对所述渲染功能界面中的输入信息,确定渲染模板。[0112]在本发明的一个实施例中,如图14所示,确定模块100包括获取单元130和第六确定单元140,其中,[0113]获取单元130,用于获取所述拍摄视频的场景信息。[0114]第六确定单元140,用于根据所述场景信息确定渲染模板。[0115]处理模块300,根据渲染模板对肢体关键点进行渲染处理并显示。[0116]需要说明的是,前述对根据用户肢体运动的视频渲染方法实施例的解释说明也适用于该实施例的根据用户肢体运动的视频渲染装置,此处不再赘述。[0117]综上所述,本发明实施例的根据用户肢体运动的视频渲染装置,确定渲染模板并根据所拍摄视频帧中的用户动作确定肢体关键点,进而,对肢体关键点进行转换处理生成清染坐标,最终,根据漬染模板对拍摄视频巾贞的肢体关键点进行渲染处理并显示。由此,实现了渲染效果跟随用户的肢体动作显示的效果,扩展了视频显示的多样性,提高了视频显示的趣味性,增加了用户和产品的粘性。[0118]为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行上述实施例示出的根据用户肢体运动的视频渲染方法。图15示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图IS显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。[0119]如图I5所不,计算机设备I2以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件包括系统存储器28和处理单元16的总线18。[0120]总线is表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(IndustryStandardArchitecture;以下简称:ISA总线,微通道体系结构MicroChannelArchitecture;以下简称:MAC总线,增强型ISA总线、视频电子标准协会VideoElectronicsStandardsAssociation;以下简称:VESA局域总线以及外围组件互连(PeripheralComponentInterconnection;以下简称:PCI总线。[0121]计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。[0122]存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器RandomAccessMemory;以下简称:RAM30和或高速缓存存储器32。计算机设备12可以进一步包括其它可移动不可移动的、易失性非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图15未显示,通常称为“硬盘驱动器”)。尽管图15中未示出,可以提供用于对可移动非易失性磁盘例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(CompactDiscReadOnlyMemory;以下简称:CD-ROM、数字多功能只读光盘(DigitalVideoDiscReadOnlyMemory;以下简称:DVD-ROM或者其它光介质读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组例如至少一个程序模块,这些程序模块被配置以执行本发明各实施例的功能。[0123]具有一组(至少一个程序模块42的程序实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和或方法。[0124]计算机设备12也可以与一个或多个外部设备14例如键盘、指向设备、显示器24等通信,还可与一个或者多个使得用户能与该计算机系统服务器12交互的设备通信,和或与使得该计算机系统服务器12能与一个或多个其它计算设备进行通信的任何设备例如网卡,调制解调器等等通信。这种通信可以通过输入输出(IO接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LocalAreaNetwork;以下简称:LAN,广域网WideAreaNetwork;以下简称:WAN和或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。[0125]处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。[0126]为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行上述实施例示出的根据用户肢体运动的视频渲染方法。图16是图示根据本发明一个实施例的计算机可读存储介质的示意图。如图16所示,根据本发明实施例的计算机可读存储介质3〇〇,其上存储有非暂时性计算机可读指令301。当该非暂时性计算机可读指令301由处理器运行时,执行前述的本发明各实施例的根据用户肢体运动的视频渲染方法的全部或部分步骤。[0127]图17是根据本发明一个实施例的终端设备的硬件结构示意图。终端设备可以以各种形式来实施,本公开中的终端设备可以包括但不限于诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA个人数字助理)、PAD平板电脑)、PMP便携式多媒体播放器)、导航装置、车载终端设备、车载显示终端、车载电子后视镜等等的移动终端设备以及诸如数字TV、台式计算机等等的固定终端设备。[0128]如图17所示,终端设备1100可以包括无线通信单元111〇、AV音频视频输入单元1120、用户输入单元1130、感测单元1140、输出单元1150、存储器1160、接口单元1170、控制器1180和电源单元1190等等。图17示出了具有各种组件的终端设备,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。[0129]其中,无线通信单元1110允许终端设备1100与无线通信系统或网络之间的无线电通信。AV输入单元112〇用于接收音频或视频信号。用户输入单元1130可以根据用户输入的命令生成键输入数据以控制终端设备的各种操作。感测单元1140检测终端设备1100的当前状态、终端设备1100的位置、用户对于终端设备1100的触摸输入的有无、终端设备1100的取向、终端设备1100的加速或减速移动和方向等等,并且生成用于控制终端设备1100的操作的命令或信号。接口单元1170用作至少一个外部装置与终端设备1100连接可以通过的接口。输出单元1150被构造为以视觉、音频和或触觉方式提供输出信号。存储器1160可以存储由控制器1180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据。存储器1160可以包括至少一种类型的存储介质。而且,终端设备1100可以与通过网络连接执行存储器1160的存储功能的网络存储装置协作。控制器1180通常控制终端设备的总体操作。另外,控制器1180可以包括用于再现或回放多媒体数据的多媒体模块。控制器1180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。电源单元1190在控制器1180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。[0130]本公开提出的根据用户肢体运动的视频渲染方法的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,本公开提出的根据用户肢体运动的视频渲染方法的各种实施方式可以通过使用特定用途集成电路ASIC、数字信号处理器DSP、数字信号处理装置DSPD、可编程逻辑装置PLD、现场可编程门阵列FPGA、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,本公开提出的根据用户肢体运动的视频渲染方法的各种实施方式可以在控制器1180中实施。对于软件实施,本公开提出的根据用户肢体运动的视频渲染方法的各种实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序或程序来实施,软件代码可以存储在存储器1160中并且由控制器1180执行。—[0131]在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。[0132]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。[0133]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。[0134]在流程图中表示或在此以其他方式描述的逻辑和或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,〃计算机可读介质〃可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例非穷尽性列表包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM,只读存储器ROM,可擦除可编辑只读存储器EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器CDR0M。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。[0135]应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列PGA,现场可编程门阵列FPGA等。[0136]本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。[0137]此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。[0138]上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

权利要求:1.一种根据用户肢体运动的视频渲染方法,其特征在于,包括以下步骤:确定渲染模板;根据所拍摄视频帧中的用户动作确定肢体关键点;对所述肢体关键点进行转换处理生成渲染坐标;_根据所述渲染模板和所述渲染坐标对所述肢体关键点进行渲染处理并显示。+2.如权利要求1所述的方法,其特征在于,所述根据所拍摄视频帧中的用户动作确体关键点,包括:根据肢体骨骼的运动变化建立骨骼三维数据;根据所述骨骼三维数据和动态目标跟踪算法识别拍摄视频帧中的用户动作确定关键点。、3.如权利要求1所述的方法,其特征在于,所述根据所拍摄视频帧的用户动作确定肢#关键点,包括:根据边界轮廓算法确定拍摄视频帧的图案区域;从所述图案区域中提取图案特征;将所述图案特征与所述肢体关键点对应的样本图案特征进行匹配;根据匹配结果确定拍摄视频帧的肢体关键点。4.如权利要求1所述的方法,其特征在于,所述对所述肢体关键点进行转换处理生成胃染坐标,包括:根据拍摄参数确定关键点容器模型;根据所述关键点容器模型对所述肢体关键点进行转换处理,生成渲染坐标。5.如权利要求1所述的方法,其特征在于,所述确定渲染模板,包括:显示预先设置的渲染功能界面;根据用户对所述渲染功能界面中的输入信息,确定渲染模板。6.如权利要求1所述的方法,其特征在于,所述确定渲染模板,包括:获取所述拍摄视频的场景信息;根据所述场景信息确定渲染模板。7.如权利要求1-6任一所述的方法,其特征在于,所述渲染模板包括:渲染时间、渲染角度、渲染大小、渲染颜色、渲染模式中的一种或者多种参数组合。8.—种根据用户肢体运动的视频渲染装置,其特征在于,包括:确定模块,确定渲染模板;生成模块,用于对所述肢体关键点进行转换处理生成渲染坐标;处理模块,根据所述渲染模板和所述渲染坐标对所述肢体关键点进行渲染处理并显不。9.如权利要求8所述的装置,其特征在于,所述生成模块,包括:建立单元,用于根据肢体骨骼的运动变化建立骨骼三维数据;第一确定单元,用于根据所述骨骼三维数据和动态目标跟踪算法识别每个拍摄视频帧中的用户动作确定肢体关键点。10.如权利要求8所述的装置,其特征在于,所述生成模块,包括:第二确定单元,用于根据边界轮廓算法确定拍摄视频帧的图案区域;提取单元,用于从所述图案区域中提取图案特征;匹配单元,用于将所述图案特征与所述肢体关键点对应的样本图案特征进行匹配;第三确定单元,用于根据匹配结果确定拍摄视频帧的肢体关键点。11.如权利要求8所述的装置,其特征在于,所述生成模块,包括:第四确定单元,用于根据拍摄参数确定关键点容器模型;生成单元,用于根据所述关键点容器模型对所述肢体关键点进行转换处理,生成渲染坐标。12.如权利要求8所述的装置,其特征在于,所述确定模块,包括:显示单元,用于显示预先设置的渲染功能界面;第五确定单元,用于根据用户对所述渲染功能界面中的输入信息,确定渲染模板。13.如权利要求8所述的装置,其特征在于,所述确定模块,包括:获取单元,用于获取所述拍摄视频的场景信息;第六确定单元,用于根据所述场景信息确定渲染模板。14.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令处理器执行时实现如权利要求1-7任一项所述的根据用户肢体运动的视频渲染方法。15.—种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的根据用户肢体运动的视频渲染方法。16.—种终端设备,其特征在于,包括如权利要求8-13任一所述的根据用户肢体运动的视频渲染装置。

百度查询: 北京微播视界科技有限公司 根据用户肢体运动的视频渲染方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术