买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种实现影视识别的方法和装置_阿里巴巴集团控股有限公司_201610008600.1 

申请/专利权人:阿里巴巴集团控股有限公司

申请日:2016-01-06

公开(公告)日:2021-05-07

公开(公告)号:CN106951423B

主分类号:G06F16/48(20190101)

分类号:G06F16/48(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.05.07#授权;2017.08.08#实质审查的生效;2017.07.14#公开

摘要:本申请提供了一种实现影视识别的方法和装置,其中,方法包括:服务端接收客户端发送的当前播放的影视资源的字幕文件;服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件匹配的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。本发明无需识别图像,仅通过字幕文件来识别,而字幕文件都是文本信息,其识别过程简单,计算量相对较少,因此,本发明能够有效缓解服务端的计算压力,以提高服务端的针对影视资源播放情况的统计效率。

主权项:1.一种实现影视识别的方法,其特征在于,所述方法包括:服务端接收客户端发送的当前播放的影视资源的字幕文件;其中,所述字幕文件包括在当前播放的影视资源未关联有字幕文件时生成的字幕文件;服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;所述比较包括比较字幕信息之间的相似度,以及在判断最大相似度大于预设阈值时,则确定所述字幕信息库中包含与所述接收到的字幕文件相同的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。

全文数据:一种实现影视识别的方法和装置技术领域[0001]本申请涉及多媒体技术领域,特别涉及一种实现影视识别的方法和装置。背景技术[0002]随着互联网技术的不断发展,网络上的影视资源越来越丰富,人们已经习惯于在网络上来搜索并观看自己喜欢的影视资源。例如,用户可以通过网络机顶盒,在电视上免费观看高清影视资源;也可以在视频网站上搜索查看自己感兴趣的影视资源。[0003]为了能够给用户推送热播或用户感兴趣的影视资源,网络服务器需要做大数据统计,统计影视资源的播放情况,根据统计的播放情况为用户推送影视资源。[0004]目前,常用的统计方式是,根据用户观看的影视资源的多帧图像,匹配网络服务器存储的影视资源,如果匹配成功,则识别出用户当前关联的影视资源,进而记录该影视资源被播放。但这种基于图像的识别方式,需要网络服务器配置有强大的图像分析系统,整个识别过程中数据计算量较大,网络服务器的计算压力较大。发明内容[0005]本发明所要解决的技术问是提供一种实现影视识别的方法,用以利用字幕文件实现对用户播放的影视资源的识别,能够有效缓解网络服务器的计算压力,进而提高网络服务器的针对影视资源播放情况的统计效率。[0006]本发明还提供了一种实现影视识别的装置,用以保证上述方法在实际中的实现及应用。[0007]在本发明第一方面提供了一种利用字幕信息实现影视识别的方法,所述方法包括:[0008]服务端接收客户端发送的当前播放的影视资源的字幕文件;[0009]服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;[0010]如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。[0011]在本发明第二方面提供了一种利用字幕信息实现影视识别的装置,所述装置包括:[0012]字幕文件接收单元,用于接收客户端发送的当前播放的影视资源的字幕文件;[0013]比较单元,用于服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则执行识别单元;—[0014]识别单元,用于根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。[0015]与现有技术相比,本发明提供的技术方案具有以下有益效果:[0016]在发明技术方案中,服务端接收客户端发送的当前播放的影视资源的字幕文件;服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。与现有技术中通过图像识别影视资源的方式相比,本发明无需识别图像,仅通过字幕文件来识别,而字幕文件都是文本信息,其识别过程简单,计算量相对较少,因此,本发明能够有效缓解服务端的计算压力,进而提高服务端针对影视资源播放情况的统计效率。附图说明[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。[0018]图1是本发明实施例提供的一种实现影视识别的方法的流程图;[0019]图2是本发明实施例提供的一种实现影视识别的装置的结构图。具体实施方式[0020]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。[0021]本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。[0022]本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。[0023]参考图1,图1是本发明实施例提供的一种实现影视识别的方法的流程图,如图丄所示,该方法可以包括步骤101-103:[0024]步骤101:服务端接收客户端发送的当前播放的影视资源的字幕文件。[0025]在实现时,本发明实施例中的客户端,是指能够与服务端通信的、支持影视资源传输、播放的设备。如电视盒子、电脑、笔记本或者手机等。例如,用户可以通过电视盒子,在电视上观看影视资源;或者,用户可以在电脑上通过视频网站观看影视资源。[0026]在实现时,客户端负责收集用户正在观看的影视资源的字幕文件。如果,当前播放的影视带有内置或外置的字幕文件,则客户端通过文件读取的方式将字幕文件发送给服务器。字幕文件是指包含影视资源的字幕的文件,字幕是指以文字形式显示电视、电影、或者舞台作品里面的对话等非影像内容,可以理解为影视作品后期加工的文字。字幕文件具有多种文件格式,如31113、3:1:1;、333、33、3111;1_、\33、〇31、1\1:、3313等文本格式。在本发明实施例中,对字幕文件的具体格式不作限定。[0027]在实现时,如果当前播放的影视资源未关联有字幕文件时,则客户端采用光学字符识别技术OCR技术),分析当前播放的影视资源中的字幕信息,将所述字幕信息打包成文件,以生成当前播放的影视资源的字幕文件。[0028]步骤102:服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果预先存储的字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则执行步骤103。[0029]在实现时,服务端预先存储有字幕信息库,该字幕信息库包括:影视资源唯一标识和对应的字幕文件;其中,一个影视资源唯一标识对于一个影视资源而言是唯一的。在实现时,可以根据影视资源的视频标题、视频描述信息、演员、上映时间等信息来生成影视资源唯一标识。在实现时,一个影视资源可能对应有多种语言的字幕文件,因此,在字幕信息库中,一个影视资源唯一标识可以对应多个不同语言的字幕文件。例如,一个电影配置有中文字幕和英文字幕,则在字幕信息库中存储有该电影的影视资源唯一标识和对应的中文字幕文件和英文字幕文件。[0030]在实现时,步骤102可以按照如下方式实现,该方式包括:S11-S12[0031]S11:所述服务端提取接收到的所述字幕文件的属性信息;[0032]S12:所述服务端判断所述属性信息与字幕信息库中某一字幕文件的属性信息是否相同,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0033]在实现时,字幕文件的属性信息可以包括以下一种或其几种组合:[0034]文件名称、文件创建时间、文件大小、字幕格式、字幕语种。在该方式中,服务端维护的字幕信息库中每个字幕文件都具有各自的属性信息,基于此,服务端通过字幕文件属性信息的对比来识别客户端发送的字幕文件是否与服务端存储的字幕信息库中的某个字幕文件相同。如果,客户端发送的字幕文件的属性信息与字幕信息库中的某个字幕文件的属性信息相同,则认为客户端发送的字幕文件与字幕信息库中该字幕文件相同,即,表明字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0035]例如:客户端发送的字幕文件的属性信息具体为:[0036]文件名称为“阿凡达中文字幕”;[0037]文件创建时间为“2010年10月1日”;[0038]文件大小为“6〇KB”;[0039]字幕格式为“SSA”;[0040]字幕语种为“中文”;[0041]如果,服务端存储的字幕信息库中,有一个字幕文件的属性信息与客户端发送的字幕文件的上述属性信息一致,则认为所述字幕文件与字幕信息库中的该字幕文件相同,艮口,表明字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0042]在实现时,步骤102还可以按照如下方式实现,该方式包括:S21_S22[0043]S21:所述服务端提取接收到的所述字幕文件包含的字幕信息;[0044]S22:所述服务端计算所述字幕信息与字幕信息库中每个字幕文件包含的字幕信息之间的相似度,并判断最大相似度是否大于预设阈值,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0045]在实现时,服务端通过字幕信息,分别计算客户端发送的字幕文件与服务端维护的每个字幕文件之间的相似度;其中,字幕信息是指字幕文件包含的具体字幕内容;字幕信息可以是中文、英文、日文等任何语言形式、任何格式的文本信息。[0046]服务端根据计算得到的相似度的大小关系,从字幕信息库中选择与客户端发送的字幕文件相似度最大的字幕文件,并判断该最大相似度是否大于预设阈值,阈值大小可以根据实际需求而设定。如果该最大相似度大于预设阈值,则认为客户端发送的字幕文件与字幕信息库中与其相似度最大的字幕文件是相同的,即,表明字幕信息库包含与所述接收到的字幕文件相同的字幕文件。例如:服务端存储有字幕信息库,字幕信息库中包括:影视资源唯一标识与对应的字幕文件,具体如下:[0047]影视资源唯一标识一一对应的字幕文件[0048]影视资源唯一标识A00001——字幕文件1;[0049]影视资源唯一标识A00002——字幕文件2;[0050]影视资源唯一标识A00003——字幕文件3;[0051]影视资源唯一标识A00004——字幕文件4;[0052]影视资源唯一标识A00005——字幕文件5;[0053]客户端发送的字幕文件B,服务端根据字幕文件包含字幕信息,分别计算字幕文件B与字幕信息库中的字幕文件1、字幕文件2、字幕文件3、字幕文件4、字幕文件5之间的相似度。计算结果如下:[0054]字幕文件B与字幕文件1之间的相似度为30%;[0055]字幕文件B与字幕文件2之间的相似度为45%;[0056]字幕文件B与字幕文件3之间的相似度为10%;[0057]字幕文件B与字幕文件4之间的相似度为60%;[0058]字幕文件B与字幕文件5之间的相似度为95%;[0059]从计算结果可知:字幕信息库中的字幕文件5与客户端发送的字幕文件B之间的相似度最大,假设预设阈值为80%,则最大相似度大于预设阈值,则认为客户端发送的字幕文件B与字幕信息库中与其相似度最大的字幕文件5是相同的,g卩,表明字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0060]在本发明实施例中,字幕信息之间的相似度的计算采用文本相似度计算工具来实现,当然也可以采用其他工具或者算法来实现,本发明对此不作具体限定。[0061]步骤103:服务端根据字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。[0062]执行完毕步骤102,如果服务端比较出字幕信息库包含与所述接收到的字幕文件相同的字幕文件,在这种情况下,服务端就能够识别出客户端当前播放的影视资源为字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识所标识的影视资源。[0063]例如:在上述示例中,客户端发送的字幕文件B与服务端字幕信息库中的字幕文件5相同,即,字幕信息库包含与所述接收到的字幕文件相同的字幕文件,此时,服务端就能够识别出客户端当前播放的影视资源是字幕文件5对应的影视资源唯一标识A00005所标识的影视。[0064]在识别出客户端当前播放的影视资源后,服务端还可以根据识别结果累计该影视资源的观看次数。在实现时,具体是在上述方法的基础上,还可以增加如下步骤:[0065]所述服务端累计所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识所标识的影视资源的观看次数。[0066]以上述示例为例,在服务端识别出客户端当前播放的影视为影视资源唯一标识A00005所标识的影视;则服务端累计字幕文件5对应的影视资源唯一标识A00005所标识的影视的观看次数。在实现时,服务端可以利用计数器来实现观看次数的累计功能。通过这种识别方式,服务端可以快速的识别客户端当前播放的影视资源,进而提高服务器的针对影视资源播放情况的统计效率。[0067]在本发明技术方案中,服务端接收客户端发送的当前播放的影视资源的字幕文件;服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。与现有技术中通过图像识别影视资源的方式相比,服务端无需维护庞大的影视资源,也无需具备强大的图像分析能力,在实现时,本发明无需识别图像,仅通过字幕文件来识别,而字幕文件都是文本信息,其识别过程简单,计算量相对较少,因此,本发明能够有效缓解服务端的计算压力,进而提高服务端的针对影视资源播放情况的统计效率。[0068]与上述方法相对应的,本发明还提供了一种利用字幕信息实现影视识别的装置。下面对该装置进行解释说明。[0069]参见图2,图2是本发明实施例提供的一种实现影视识别的装置的结构图,如图2所示,该装置可以包括:[0070]字幕文件接收单元201,用于接收客户端发送的当前播放的影视资源的字幕文件;[0071]比较单元202,用于服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则执行识别单元;[0072]识别单元203,用于根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。[0073]可选的,所述字幕文件是所述客户端通过以下方式生成的:[0074]所述客户端采用光学字符识别技术,分析当前播放的影视资源中的字幕信息,将所述字幕信息打包成文件,以生成当前播放的影视资源的字幕文件。[0075]可选的,所述比较单元,包括:[0076]文件属性提取子单元,用于提取接收到的所述字幕文件的属性信息;[0077]文件属性判断子单元,用于判断所述属性信息与字幕信息库中某一字幕文件的属性信息是否相同,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0078]可选的,所述属性信息包括以下一种或其组合:[0079]文件名称、文件创建时间、文件大小、文件类型、字幕语种。[0080]可选的,所述比较单元,包括:[0081]字幕信息提取子单元,用于提取接收到的所述字幕文件包含的字幕信息;[0082]相似度判断子单元,用于计算所述字幕信息与字幕信息库中每个字幕文件包含的字幕信息之间的相似度,并判断最大相似度是否大于预设阈值,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。[0083]可选的,所述装置还包括:[0084]累计单元,用于在所述识别单元执行完毕后,累计所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识所标识的影视资源的观看次数。[0085]需要说明的是,对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。[0086]最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。[0087]以上对本申请所提供的一种实现影视识别的方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

权利要求:1.一种实现影视识别的方法,其特征在于,所述方法包括:服务端接收客户端发送的当前播放的影视资源的字幕文件;服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。2.根据权利要求1所述的方法,其特征在于,所述字幕文件是所述客户端通过以下方式生成的:所述客户端采用光学字符识别技术,分析当前播放的影视资源中的字幕信息,将所述字幕信息打包成文件,以生成当前播放的影视资源的字幕文件。3.根据权利要求1所述的方法,其特征在于,所述服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较的步骤,包括:所述服务端提取接收到的所述字幕文件的属性信息;所述服务端判断所述属性信息与字幕信息库中某一字幕文件的属性信息是否相同,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。4.根据权利要求3所述的方法,其特征在于,所述属性信息包括以下一种或其组合:文件名称、文件创建时间、文件大小、字幕格式、字幕语种。5.根据权利要求1所述的方法,其特征在于,所述服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较的步骤,包括:所述服务端提取接收到的所述字幕文件包含的字幕信息;所述服务端计算所述字幕信息与字幕信息库中每个字幕文件包含的字幕信息之间的相似度,并判断最大相似度是否大于预设阈值,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。6.根据权利要求1所述的方法,其特征在于,在所述服务端根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源之后,所述方法还包括:所述服务端累计所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识所标识的影视资源的观看次数。7.—种实现影视识别的装置,其特征在于,所述装置包括:字幕文件接收单元,用于接收客户端发送的当前播放的影视资源的字幕文件;比较单元,用于服务端将接收到的所述字幕文件与预先存储的字幕信息库中的字幕文件进行比较,其中,字幕信息库包括:影视资源唯一标识和对应的字幕文件;如果所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件,则执行识别单元;识别单元,用于根据所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识识别客户端当前播放的影视资源。8.根据权利要求7所述的装置,其特征在于,所述字幕文件是所述客户端通过以下方式生成的:所述客户端采用光学字符识别技术,分析当前播放的影视资源中的字幕信息,将所述字幕信息打包成文件,以生成当前播放的影视资源的字幕文件。9.根据权利要求7所述的装置,其特征在于,所述比较单元,包括:文件属性提取子单元,用于提取接收到的所述字幕文件的属性信息;文件属性判断子单元,用于判断所述属性信息与字幕信息库中某一字幕文件的属性信息是否相同,如果是,则表明所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。10.根据权利要求9所述的装置,其特征在于,所述属性信息包括以下一种或其组合:文件名称、文件创建时间、文件大小、文件类型、字幕语种。11.根据权利要求7所述的装置,其特征在于,所述比较单元,包括:字幕信息提取子单元,用于提取接收到的所述字幕文件包含的字幕信息;相似度判断子单元,用于计算所述字幕信息与字幕信息库中每个字幕文件包含的字幕信息之间的相似度,并判断最大相似度是否大于预设阈值,如果是,则所述字幕信息库包含与所述接收到的字幕文件相同的字幕文件。12.根据权利要求7所述的装置,其特征在于,所述装置还包括:累计单元,用于在所述识别单元执行完毕后,累计所述字幕信息库中与所述接收到的字幕文件相同的字幕文件对应的影视资源唯一标识所标识的影视资源的观看次数。

百度查询: 阿里巴巴集团控股有限公司 一种实现影视识别的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。