买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】广告识别方法及装置_海信视像科技股份有限公司_201710501289.9 

申请/专利权人:海信视像科技股份有限公司

申请日:2017-06-27

公开(公告)日:2020-06-23

公开(公告)号:CN107392111B

主分类号:G06K9/00(20060101)

分类号:G06K9/00(20060101);G06K9/32(20060101);H04N21/431(20110101);H04N21/44(20110101);H04N21/454(20110101)

优先权:

专利状态码:有效-授权

法律状态:2020.06.23#授权;2017.12.19#实质审查的生效;2017.11.24#公开

摘要:本发明公开了一种广告识别方法及装置,属于多媒体领域。所述方法包括:在视频流的播放过程中,提取视频流的关键帧;基于识别模板,对关键帧的指定区域中的字符进行识别;如果识别模板识别出字符中包含数字,则确定视频流的类型为广告,数字用于指示视频流的剩余播放时长。本发明通过识别模板,识别当前播放的视频流的关键帧的指定区域中的字符是否包含数字,从而确定该视频流是否为广告。通过广告的播放倒计时特性来对广告进行识别,只需识别播放画面的指定区域中用于体现该播放倒计时特性的数字信息,避免了整个播放画面以及汉字等其他非数字字符的识别过程,能够大大简化识别过程,提高识别效率和准确率。

主权项:1.一种广告识别方法,其特征在于,所述方法包括:在视频流的播放过程中,提取所述视频流的关键帧;确定所述关键帧的指定区域中字符区域的个数,根据所述字符区域的个数,从识别模板中选择字符个数与所述字符区域的个数相同的目标识别模板,根据所述目标识别模板中的字符组合规律,确定所述字符区域中的数字区域,其中,每个字符区域仅包含一个字符,所述识别模板通过分析多个广告样本得到,且所述识别模板为一种或多种;基于数字识别模型,对所述数字区域进行识别,得到所述指定区域中的字符所包含的数字;如果所述识别模板识别出所述字符中包含数字,则确定所述视频流的类型为广告,所述数字用于指示所述视频流的剩余播放时长。

全文数据:广告识别方法及装置技术领域[0001]本发明涉及多媒体领域,尤其涉及一种广告识别方法及装置。背景技术[0002]人们在观看网络视频时,由于目前视频网站的经营策略,在视频的播放过程中都会插播广告,这些广告的播放时机可以在片头、片中或片尾,播放时长可以从几秒到几分钟不等。广告的播放会打断用户对当前视频的观看,影响用户的观看体验,因此,亟需一种广告识别方法,对视频播放过程中插播的广告进行识别,从而自动地跳过识别出来的广告。[0003]目前,广告识别的方法可以如下:采集多个已知广告作为广告样本,提取广告样本的某一帧或多帧画面作为广告样本的特征,存储至广告数据库。在视频的播放过程中,提取当前视频的播放画面,进而将当前视频的播放画面与广告数据库中广告样本的画面进行一一比对,以查找与当前视频相同或相似的广告样本,如果能找到,则可以确定当前视频是插播的广告,如果不能找到,则可以确定当前视频不是插播的广告。[0004]在实现本发明的过程中,发明人发现现有技术至少存在以下问题:[0005]上述技术在识别广告时需依赖广告数据库,在识别时需要将当前视频与广告数据库中的广告样本进行一一比对,且需要将当前帧图像中的所有图像特征与广告样本进行比对,广告识别时间长,识别效率低,且只能识别到与广告样本具有相同或相似画面的广告,即使当前视频为非广告,但如果当前视频的播放画面与广告样本相同或相似,则容易错误地识别出当前视频为广告,识别准确率低。发明内容[0006]为了解决现有技术的问题,本发明实施例提供了一种广告识别方法及装置。所述技术方案如下:[0007]第一方面,提供了一种广告识别方法,所述方法包括:[0008]在视频流的播放过程中,提取所述视频流的关键帧;[0009]基于识别模板,对所述关键帧的指定区域中的字符进行识别,其中,所述识别模板通过分析多个广告样本得到,且所述识别模板为一种或多种;[0010]如果所述识别模板中识别出所述字符中包含数字,则确定所述视频流的类型为广告,所述数字用于指示所述视频流的剩余播放时长。[0011]在第一方面的第一种实现方式中,所述基于识别模板,对所述关键帧的指定区域中的字符进行识别,包括:[0012]根据所述识别模板中的字符组合规律和所述指定区域中的字符区域,确定所述字符区域中的数字区域,其中,每个字符区域仅包含一个字符;[0013]基于数字识别模型,对所述数字区域进行识别,得到所述字符所包含的数字。[0014]在第一方面的第二种实现方式中,所述基于识别模板,对所述关键帧的指定区域中的字符所包含的数字进行识别之前,所述方法还包括:[0015]截取所述关键帧的所述指定区域的图像;[0016]对所述指定区域的图像进行颜色过滤和二值化处理,得到第一图像;[0017]对所述第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像;[0018]根据所述第二图像中指定位置的连通区域,对所述第一图像进行截取,得到第三图像,所述指定位置的连通区域由所述关键帧的所述指定区域中的所述字符形成;[0019]采用垂直投影算法,对所述第三图像进行分割,得到所述指定区域中的所述字符区域。[0020]在第一方面的第三种实现方式中,所述基于识别模板,对所述关键帧的指定区域中的字符进行识别之后,所述方法还包括:[0021]如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中已经包括最新识别模板,则确定所述视频流的类型为非广告;[0022]如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中不包括最新识别模板,则获取所述最新识别模板,基于所述最新识别模板对所述关键帧的所述指定区域中的所述字符进行识别。[0023]在第一方面的第四种实现方式中,所述确定所述视频流的类型为广告之后,所述方法还包括:[0024]根据识别出的所述数字,跳转到所述视频流的结尾,继续播放所述视频流的下一段视频流;或,[0025]基于所述视频流的下一段视频流的地址,下载并播放所述下一段视频流。[0026]第二方面,提供了一种广告识别装置,所述装置包括:[0027]提取模块,用于在视频流的播放过程中,提取所述视频流的关键帧;[0028]识别模块,用于基于识别模板,对所述关键帧的指定区域中的字符进行识别,其中,所述识别模板通过分析多个广告样本得到,且所述识别模板为一种或多种;[0029]确定模块,用于如果所述识别模板识别出所述字符中包含数字,则确定所述视频流的类型为广告,所述数字用于指示所述视频流的剩余播放时长。[0030]在第二方面的第一种实现方式中,所述识别模块,用于根据所述识别模板中的字符组合规律和所述指定区域中的字符区域,确定所述字符区域中的数字区域,每个字符区域包含一个字符;基于数字识别模型,对所述数字区域进行识别,得到所述字符所包含的数字。[0031]在第二方面的第二种实现方式中,所述装置还包括:[0032]截取模块,用于截取所述关键帧的所述指定区域的图像;[0033]二值化模块,用于对所述指定区域的图像进行颜色过滤和二值化处理,得到第一图像;[0034]膨胀模块,用于对所述第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像;[0035]所述截取模块,还用于根据所述第二图像中指定位置的连通区域,对所述第一图像进行截取,得到第三图像,所述指定位置的连通区域由所述关键帧的所述指定区域中的所述字符形成;[0036]分割模块,用于采用垂直投影算法,对所述第三图像进行分割,得到所述指定区域中的所述字符区域。[0037]在第二方面的第三种实现方式中,所述装置还包括:[0038]所述确定模块,还用于如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中已经包括最新识别模板,则确定所述视频流的类型为非广告;[0039]获取模块,用于如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中不包括最新识别模板,则获取所述最新识别模板,基于所述最新识别模板对所述关键帧的所述指定区域中的所述字符进行识别。[0040]在第二方面的第四种实现方式中,所述装置还包括:[0041]播放模块,用于根据识别出的所述数字,跳转到所述视频流的结尾,继续播放所述视频流的下一段视频流;或,[0042]下载模块,用于基于所述视频流的下一段视频流的地址,下载并播放所述下一段视频流。[0043]第三方面,提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的计算机程序,实现第一方面任一种实现方式所述的方法步骤。[0044]第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一种实现方式所述的方法步骤。[0045]本发明实施例提供的技术方案带来的有益效果是:[0046]通过识别模板,识别当前播放的视频流的关键帧的指定区域中的字符是否包含数字,从而确定该视频流是否为广告。本发明实施例通过预设一种或多种识别模板,进而在广告识别时,只需判断关键帧图像的指定区域中字符对应的数字与识别模板是否匹配,所述指定区域中字符对应的数字与该识别模板匹配时,则判断该视频流为广告;通过广告的播放倒计时特性来对广告进行识别,只需识别播放画面中用于显示播放倒计时信息的指定区域以及该指定区域中用于体现该播放倒计时特性的数字信息,避免了整个播放画面以及汉字等其他非数字字符的识别过程,能够大大简化识别过程,提高识别效率和准确率。附图说明[0047]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0048]图1是本发明实施例提供的一种广告识别方法的流程图;[0049]图2是本发明实施例提供的一种广告识别方法的流程图;[0050]图3是本发明实施例提供的一种指定区域的示意图;[0051]图4A是本发明实施例提供的一种关键帧的示意图;[0052]图4B是本发明实施例提供的一种指定区域的图像的示意图;[0053]图4C是本发明实施例提供的一种第一图像的示意图;[0054]图4D是本发明实施例提供的一种第二图像的示意图;[0055]图4E是本发明实施例提供的一种第三图像的示意图;[0056]图4F是本发明实施例提供的一种字符区域的示意图;[0057]图4G是本发明实施例提供的一种数字的示意图;[0058]图5是本发明实施例提供的一种广告倒计时信息与识别模板的对应模式不意图;[0059]图6是本发明实施例提供的一种广告识别过程的流程图;[0060]图7是本发明实施例提供的一种广告识别装置的结构示意图;[0061]图8是本发明实施例提供的一种广告识别装置的结构示意图;[0062]图9是本发明实施例提供的一种广告识别装置的结构示意图;[0063]图10是本发明实施例提供的一种广告识别装置的结构示意图;[0064]图11是本发明实施例提供的一种广告识别装置的结构示意图;[0065]图12是本发明实施例提供的一种电子设备1200的结构示意图。具体实施方式[0066]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。[0067]图1是本发明实施例提供的一种广告识别方法的流程图。参见图1,该方法包括:[0068]101、在视频流的播放过程中,提取该视频流的关键帧。[0069]102、基于识别模板,对该关键帧的指定区域中的字符进行识别,其中,该识别模板通过分析多个广告样本得到,且该识别模板为一种或多种。[0070]103、如果该识别模板识别出该字符中包含数字,则确定该视频流的类型为广告,该数字用于指示该视频流的剩余播放时长。[0071]本发明实施例提供的方法,通过识别模板,识别当前播放的视频流的关键帧的指定区域中的字符是否包含数字,从而确定该视频流是否为广告。通过广告的播放倒计时特性来对广告进行识别,只需识别播放画面中用于显示播放倒计时信息的指定区域以及该指定区域中用于体现该播放倒计时特性的数字信息,避免了整个播放画面以及汉字等其他非数字字符的识别过程,能够大大简化识别过程,提高识别效率和准确率。[0072]可选地,该基于识别模板,对该关键帧的指定区域中的字符进行识别,包括:[0073]根据该识别模板中的字符组合规律和该指定区域中的字符区域,确定该字符区域中的数字区域,每个字符区域仅包含一个字符;[0074]基于数字识别模型,对该数字区域进行识别,得到该字符所包含的数字。[0075]可选地,该基于识别模板,对该关键帧的指定区域中的字符所包含的数字进行识别之前,该方法还包括:[0076]截取该关键帧的该指定区域的图像;[0077]对该指定区域的图像进行颜色过滤和二值化处理,得到第一图像;[0078]对该第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像;[0079]根据该第二图像中指定位置的连通区域,对该第一图像进行截取,得到第三图像,该指定位置的连通区域由该关键帧的该指定区域中的字符形成;[0080]采用垂直投影算法,对该第三图像进行分割,得到该指定区域中的字符区域。[0081]可选地,该基于识别模板,对该关键帧的指定区域中的字符进行识别之后,该方法还包括:[0082]如果该识别模板不能识别出该字符中包含数字,且该识别模板中已经包括最新识别模板,则确定该视频流的类型为非广告;[0083]如果该识别模板不能识别出该字符中包含数字,且该识别模板中不包括最新识别模板,则获取该最新识别模板,基于该最新识别模板对该关键帧的指定区域中的字符进行识别。[0084]可选地,该确定该视频流的类型为广告之后,该方法还包括:[0085]根据识别出的该数字,跳转到该视频流的结尾,继续播放该视频流的下一段视频流;或,[0086]基于该视频流的下一段视频流的地址,下载并播放该下一段视频流。[0087]上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再--'赘述。[0088]图2是本发明实施例提供的一种广告识别方法的流程图。该方法由电子设备执行,参见图2,该方法包括:[0089]201、在视频流的播放过程中,提取该视频流的关键帧。[0090]其中,视频流中每一幅画面叫一帧,视频流的关键帧可以是该视频流中的某一幅画面,也就是该视频流的关键图像数据,如I帧(IFrame,又称为内部画面(intrapicture,它是帧间压缩编码里的重要帧,它是一个全帧压缩的编码帧,解码时仅用〗帧的数据即可重构完整图像。[0091]本发明实施例中,电子设备在每次下载到网络视频流片段后,可以采用任一种视频关键帧提取算法,基于底层多媒体中间件的Decoder解码器部分,对本段视频流进行解码后,提取本段视频流的关键帧。[0092]考虑到在广告的播放画面中,电子设备一般会采用字符的形式,显示广告的倒计时信息。因此,如果当前播放的视频流为广告,则在该广告的每一帧播放画面上都会有该广告的倒计时信息,不同时刻的播放画面上的倒计时信息不同,例如当前时刻的播放画面上的倒计时信息为“广告29秒”。则上一时刻的播放画面上的倒计时信息可以为“广告30秒”。而关键帧是该广告的某一帧播放画面,因此该关键帧中也会包含倒计时信息,电子设备可以通过识别当前播放的视频流的关键帧的指定区域中的字符,确定该关键帧中是否包含倒计时信息,进而确定当前播放的视频流是否为广告。[0093]2〇2、获取该关键帧的指定区域中的字符区域,每个字符区域包含一个字符。[0094]参见图3,图3是本发明实施例提供的一种指定区域的示意图,考虑到广告倒计时信息一般在当前播放画面的右上角,因此,电子设备可以将该关键帧的右上角区域作为该指定区域,该右上角区域与该关键帧的尺寸比例可以为预设比例,如丨“或丨作。当然,该指定区域还可以有其他备选区域,如图3中备选区域可以为当前播放画面的左上角区域、右下角区域或左下角区域,本发明实施例对此不做限定。[0095]本发明实施例中,如果当前播放的视频流为广告,则关键帧的指定区域中的字符区域即是广告倒计时信息显示的区域,为此,电子设备可以先获取该关键帧的指定区域中的字符区域,并通过识别该字符区域的字符,得到具体的广告倒计时信息。在一种可能实现力式中,该夫键帧的指定区域中的字符区域的获取过程可以包括下述步骤31至5:[0096]al、截取该关键帧的指定区域的图像;[00^7]参见图4A和图4B,图4A是本发明实施例提供的一种关键帧的示意图,图4B是本发明实施例提供的一种指定区域的图像的示意图,通过截取图4A中的指定区域,可以得到如图4B所示的图像。[0098]通过截取包含广告倒计时信息的指定区域的图像,使得电子设备无需对关键帧的^个图像进行处理,而只需对该指定区域的图像进行处理,即可实现对广告的识别,由于指定区域的图像只是该关键帧的部分图像,因此可以降低处理复杂度,节约计算资源,提升广告识别的效率;同时由于无需对整个视频画面进行分析判断,也相应的排除了该关键帧中其他区域的图像对该指定区域的干扰,提高了广告识别的准确性。[0099]、对该指定区域的图像进行颜色过滤和二值化处理,得到第一图像。[0100]其中,对图像进行颜色过滤是指只保留图像的白色部分,将图像中的其他颜色全部设置为黑色,二值化处理就是将图像上的像素点的灰度值设置为〇或255,也就是将整个图像呈现出明显的黑白效果。[0101]在该步骤a2中,电子设备对图像进行颜色过滤后可以得到灰度图像,然后再对灰度图像进行二值化处理,可以得到二值图像,也即该第一图像,其中,灰度图像在黑色与白色之间还有许多不同深度等级的颜色,但二值图像只有黑色与白色两种颜色。参见图4C,图4C是本发明实施例提供的一种第一图像的示意图,该第一图像是完全的黑底白字图像。[0102]a3、对该第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像。[0103]在该步骤a3中,电子设备可以采用任一种膨胀方法,对图4C中的第一图像二值图像进行膨胀处理,得到第二图像。参见图4D,图4D是本发明实施例提供的一种第二图像的示意图,该第二图像包含多个连通区域,每个连通区域由一串连续的字符形成,通过每个连通区域可以确定一串连续的字符。[°104]a4、根据该第二图像中指定位置的连通区域,对该第一图像进行截取,得到第三图像,该指定位置的连通区域由该关键帧的该指定区域中的字符形成。[0105]其中,该指定位置的连通区域可以是图4D中第二图像的右上角的第一个联通区域。参见图4E,图4E是本发明实施例提供的一种第三图像的示意图,电子设备可以通过第二图像中指定位置的连通区域,确定第一图像中的一串连续字符“广告9秒”,并从第一图像中截取该连续字符的图像,即图4E所示的第三图像。[0106]a5、采用垂直投影算法,对该第三图像进行分割,得到该关键帧的指定区域中的字符区域。[0107]在该步骤a5中,电子设备可以采用任一种垂直投影算法,对第三图像中的连续字符进行分割,得到一个个字符区域。参见图4F,图4F是本发明实施例提供的一种字符区域的示意图,每个字符区域包含一个字符,对图4E的第三图像进行分割,可以得到“广告9秒”等4个字符区域。[0108]电子设备在获取到关键帧的指定区域中的字符区域后,只是获知了该关键巾贞的指定区域中的字符个数,但并未确定每个字符区域对应的字符的具体形式,进而电子设备可以通过后续步骤203识别该字符区域对应的字符,根据识别结果确定当前播放的视频流的类型广告或非广告)。L〇1〇9」203、基于识别模板,对该关键帧的指定区域中的字符进行识别,其中,该识别模板通过分析多个广告样本得到,且该识别模板为一种或多种。[0110]其中,广告样本可以是互联网上的己知广告,每个广告样本都可以有广告倒计时信息f过对互联网上多个广告样本的倒计时信息进行分析,可以得到不同类型的广告倒计时^息,根据不同类型的广告倒计时信息,可以得到一种或多种识别模板,该一种或多种识别模板可以存储在电子设备本地。参见图5,图5是本发明实施例提供的一种广告倒计时信息与识别模板的对应模式示意图,例如,针对“广告29秒,,这种类型的广告倒计时信息,如广告样本1的广告倒计时信息为“广告6〇秒”、广告样本2的广告倒计时信息为“广告45秒”、广告样本3的广告倒计时信息为“广告10秒”,通过分析广告样本丨、广告样本2和广告样本3可以得到识别模板“WWAAW”,其中,“W”代表汉子,“A”代表数字。同理,针对“精彩8秒后继续”这种类型的广告倒计时信息,识别模板可以为“㈣TAffffWr;针对“29”这种类型的广告倒计时信息,识别模板可以为“AA”;针对“请稍等120秒”这种类型的广告倒计时信息,识别模板可以为“WWWAAAW”;针对“广告g秒”这种类型的广告倒计时信息,识别模板可以为“鼎舰”。[0111]需要说明的是,为了保证识别模板的多样性和全面性,实现识别模板的动态获取和更新,电子设备除了出厂时预置在本地的一部分识别模板外,还可以从其他设备如服务器中获取其他识别模板,本发明实施例对此不做限定。[0112]在一种可能实现方式中,该步骤203中基于多种识别模板,对该关键帧的指定区域中的字符进行识别可以包括以下步骤a和步骤b:[0113]a、根据该识别模板中的字符组合规律和该关键帧的指定区域中的字符区域,确定该字符区域中的数字区域;[01M]其中,字符组合规律可以是指数字、汉字、字母或符号之间的组合规律,每个数字区域包括一个数字。[0115]在该步骤a中,电子设备根据该识别模板中的字符组合规律和该关键帧的指定区域中的字符区域,确定该字符区域中的数字区域的过程可以包括:确定分割得到的该关键帧的指定区域中字符区域的个数,根据字符区域的个数,从识别模板中选择字符个数与字符区域的个数相同的目标识别模板,根据目标识别模板中的字符组合规律,确定这些字符区域中的数字区域。例如,关键帧的指定区域中有“广告9秒”等4个字符区域,则可以选择识别模板“WWAW”作为目标识别模板,其字符组合规律为左边两个字符区域为汉字区域“广告”,右边一个字符区域为汉字区域“秒”,剩下的中间一个字符区域为数字区域“9”。当然,参见图6,图6是本发明实施例提供的一种广告识别过程的流程图,电子设备也可以不确定目标识别模板,而是依次选择该多种识别模板中的每一个识别模板,每选择一个识别模板,则根据当前识别模板中的字符组合规律,确定这些字符区域中的数字区域,并通过步骤b识别该数字区域的数字。[0116]b、基于数字识别模型,对该数字区域进行识别,得到该字符所包含的数字。[0117]在该步骤b中,电子设备可以根据多个已知阿拉伯数字(如〇、1、2、……、9建立数字识别模型,使得电子设备可以按照该数字识别模型,对数字区域所包含的数字进行识别。例如,在建立该数字识别模型的过程中,技术人员可以基于数字己知的多个数字区域对该数字识别模型进行训练,使得基于该多个数字区域以及对应的数字等训练数据建立的该数字识别模型可以识别出任一个数字区域所包含的数字。参见图4G,图4G是本发明实施例提识叫一押双子的不思图,通过对图4F的数字区域“9”进行识别,可以得到数字9。[0118]通过识别模板识别关键帧的指定区域中的字符,可以直接定位到字符中的数字信息,避免了汉字等其他非数字字符的识别过程,提高了识别效率。[0119]204、巧果该识别模板识别出该字符中包含数字,则确定该视频流的类型为广告,该数字用于指示该视频流的剩余播放时长。[0120]本发明实施例中,每种识别模板可以是通过分析多个广告样本得到的,而每个广告样本都可以有广告倒计时信息,该广告倒计时信息中往往包含用于指示该广告剩余播放时长的数字。参见图6,如果本地的任一种识别模板能够识别出该关键帧的指定区域中的字符包含数字,则电子设备可以确定该关键帧所对应的视频流的类型为广告。[0121]可选^也,考虑到用户一般不愿意观看广告,电子设备在确定该视频流的类型为广告之后,可以米用下述任一种方式跳过当前播放的视频流,而播放该视频流的下一段视频流。[0122]第一种方式,根据识别出的该数字,跳转到该视频流的结尾,继续播放该视频流的下一段视频流。[0123]该方5是电子设备仍然会正常下载当前视频流以及当前视频流的下一段视频流,只不过由于当前视频流为广告,故电子设备可以根据识别出的数字,确定广告的剩余播放时长,然后根据该剩余播放时长,进行seek跳转动作,即将当前播放时间点跳转至广告播放结束的时间点,达到广告跳过效果,电子设备进行的这种跳转动作相当于用户拉动播放进度条的效果。[0124]第二种方式,基于该视频流的下一段视频流的地址,下载并播放该下一段视频流。[0125]该方式是电子设备在确定当前视频流为广告,且该广告为独立的视频TSTransportStream,运输流流后,由于独立的TS流有自己的下载地址,电子设备可以不从该广告的地址下载当前视频流,而直接寻址到下一段视频流,也即获取下一段视频流的地址,并基于该地址下载下一段视频流进行播放,从而达到广告跳过效果。[0126]本发明只需识别播放画面中用于体现播放倒计时特性的数字,避免了汉字等其他非数字字符的识别过程,相比于相关技术对整个播放画面的识别,本发明能够大大简化识别过程,提高识别效率。另外,现有技术通过播放画面进行识别,如果当前播放视频为非广告,但与广告样本具有相同或相似的播放画面,则会将当前播放视频识别为广告,或,如果当前播放视频为广告,但与广告样本的播放画面大不相同,则会将当前播放视频识别为非广告,识别准确率低;而本发明通过播放倒计时特性进行识别,由于播放倒计时特性为广告的通用特性,一般广告都会具有这种播放倒计时特性,故相比于现有技术,本发明的识别准确率更高。[0127]上述步骤201至步骤204是电子设备基于该识别模板识别出关键帧的指定区域中的字符包含数字,从而确定当前播放的视频流为广告的过程,当然,电子设备基于该识别模板,可能并不能识别出关键帧的指定区域中的字符包含数字,此情况下电子设备可以通过下述步骤205进一步确定当前播放的视频流的类型。[0128]205、如果该识别模板不能识别出该字符中包含数字,且该识别模板中已经包括最新识别模板,则确定该视频流的类型为非广告。[0129]本发明实施例中,考虑到广告层出不穷,新广告可能会采用新的广告倒计时信息,也即会有新的识别模板出现,这些新的识别模板可以存储在服务器,电子设备可以周期性地从该服务器中获取最新识别模板,从而对本地已有的识别模板进行更新,实现识别模板的与时俱进。参见图6,如果电子设备是在获取最新识别模板之后执行步骤203,则电子设备当前己有的该识别模板已经包括了最新识别模板,而最新识别模板不能识别出该字符中包含数字,则电子设备可以确定当前播放的视频流不是广告,则电子设备可以继续正常播放该视频流。[0130]当然,参见图6,电子设备也可能是在获取最新识别模板之前执行步骤203,则电子设备当前己有的识别模板中不包括最新识别模板,此时,电子设备可以从服务器获取该最新识别模板,并基于该最新识别模板对该关键帧的指定区域中的字符进行识别。同理,如果该最新识别模板识别出关键帧的指定区域中的字符包含数字,则电子设备可以确定当前播放的视频流是广告,否则,则可以确定当前播放的视频流不是广告。[0131]通过获取最新识别模板,并根据该最新识别模板的识别结果,进一步确定当前视频流的类型,这种针对新类型广告动态适配识别模板,可以保证识别模板的全面性,从而提高识别的准确率。而且由于电子设备可以从服务器获取最新识别模板,对本地已有模板进行更新,因此不同平台的设备,如电视、手机或PCPersonalComputer,个人计算机等均可以通过该广告识别方法实现广告的识别,提高了跨平台的可移植性。[0132]本发明实施例提供的方法,通过识别模板,识别当前播放的视频流的关键帧的指定区域中的字符是否包含数字,从而确定该视频流是否为广告。通过广告的播放倒计时特性来对广告进行识别,只需识别播放画面中用于显示播放倒计时信息的指定区域以及该指定区域中用于体现该播放倒计时特性的数字信息,避免了整个播放画面以及汉字等其他非数字字符的识别过程,能够大大简化识别过程,提高识别效率和准确率。[0133]此外,当本地的多种识别模板不能识别出关键帧的指定区域中的字符是否包含数字时,可以进一步从服务器获取最新识别模板,并根据该最新识别模板的识别结果,确定当前视频流的类型,进一步提高了识别的准确率。[0134]图7是本发明实施例提供的一种广告识别装置的结构示意图。参照图7,该装置包括:[0135]提取模块701,用于在视频流的播放过程中,提取该视频流的关键帧;[0136]识别模块702,用于基于识别模板,对该关键帧的指定区域中的字符进行识别,其中,该识别模板通过分析多个广告样本得到,且该识别模板为一种或多种;[0137]确定模块703,用于如果该识别模板识别出该字符中包含数字,则确定该视频流的类型为广告,该数字用于指示该视频流的剩余播放时长。[0138]可选地,识别模块702,用于根据该识别模板中的字符组合规律和该指定区域中的字符区域,确定该字符区域中的数字区域,每个字符区域包含一个字符;基于数字识别模型,对该数字区域进行识别,得到该字符所包含的数字。[0139]可选地,参见图8,该装置还包括:[0M0]截取模块704,用于截取该关键帧的指定区域的图像;[0141]二值化模块7〇5,用于对该指定区域的图像进行颜色过滤和二值化处理,得到第一图像;[0142]膨胀模块7〇6,用于对该第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像;[0143]截取模块704,还用于根据该第二图像中指定位置的连通区域,对该第一图像进行截取,得到第三图像,该指定位置的连通区域由该关键帧的该指定区域中的字符形成;[0144]分割模块707,用于采用垂直投影算法,对该第三图像进行分割,得到该指定区域中的字符区域。[0145]可选地,参见图9,该装置还包括:[0146]确定模块703,还用于如果该识别模板不能识别出该字符中包含数字,且该识别模板中己经包括最新识别模板,则确定该视频流的类型为非广告;[0147]获取模块708,用于如果该识别模板不能识别出该字符中包含数字,且该识别模板中不包括最新识别模板,则获取该最新识别模板,基于该最新识别模板对该关键帧的指定区域中的字符进行识别。[0148]可选地,参见图10,该装置还包括:[0149]播放模块709,用于根据识别出的该数字,跳转到该视频流的结尾,继续播放该视频流的下一段视频流;或,[0150]参见图11,该装置还包括:下载模块710,用于基于该视频流的下一段视频流的地址,下载并播放该下一段视频流。[0151]本发明实施例中,通过识别模板,识别当前播放的视频流的关键帧的指定区域中的字符是否包含数字,从而确定该视频流是否为广告。通过广告的播放倒计时特性来对广告进行识别,只需识别播放画面中用于显示播放倒计时信息的指定区域以及该指定区域中用于体现该播放倒计时特性的数字信息,避免了整个播放画面以及汉字等其他非数字字符的识别过程,能够大大简化识别过程,提高识别效率和准确率。[0152]此外,当本地的多种识别模板不能识别出关键帧的指定区域中的字符是否包含数字时,可以进一步从服务器获取最新识别模板,并根据该最新识别模板的识别结果,确定当前视频流的类型,进一步提高了识别的准确率。[0153]需要说明的是:上述实施例提供的广告识别装置在识别广告时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的广告识别装置与广告识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。[0154]图12是本发明实施例提供的一种电子设备1200的结构示意图。参见图12,该电子设备1200包括处理器、通信接口、存储器和通信总线,还可以包括输入输出接口和显示设备,其中,处理器、存储器、输入输出接口、显示设备和通信接口通过通信总线完成相互间的通信。该存储器存储有计算机程序,该处理器用于执行存储器上所存放的计算机程序,实现上述图1或图2实施例中的广告识别方法。[0155]通信总线是连接所描述的元素的电路并且在这些元素之间实现传输。例如,处理器通过通信总线从其它元素接收到命令,解密接收到的命令,根据解密的命令执行计算或数据处理。存储器可以包括程序模块,例如内核kernel,中间件middleware,应用程序编程接口(ApplicationProgrammingInterface,API和应用。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。输入输出接口转发用户通过输入输出设备例如感应器、键盘、触摸屏输入的命令或数据。显示设备显示各种信息给用户。通信接口将该电子设备1200与其它网络设备、用户设备、网络进行连接。例如,通信接口可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种:无线保真WirelessFidelity,WiFi,蓝牙(Bluetooth,BT,近距离无线通信技术NearFieldCommunication,NFC,全球卫星定位系统GlobalPositioningSystem,GPS和蜂窝通信cellularcommunication例如,长期演进技术LongTermEvolution,LTE,长期演进技术的后续演进(LongTermEvolution-Advanced,LTE-A,码分多址(CodeDivisionMultipleAccess,CDMA,宽带码分多址WidebandCDMA,WCDMA,通用移动通信系统(UniversalMobileTelecommunicationSystem,UMTS,无线宽带接入WirelessBroadband,WiBro和全球移动通讯系统(GlobalSystemforMobilecommunication,GSM。有线通信可以包括以下至少一种:通用串行总线UniversalSerialBus,USB,高清晰度多媒体接口(HighDefinitionMultimediaInterface,HDMI,异步传输标准接口RecommendedStandard232,RS-232,和普通老式电话业务(PlainOldTelephoneService,POTS。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。电子设备1200可以通过通信接口连接网络,电子设备1200和其它网络设备通信所用的协议可以被应用、应用程序编程接口(ApplicationProgrammingInterface,API、中间件、内核和通信接口至少一个支持。[0156]在示例性实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,上述计算机程序被处理器执行时实现上述实施例图1或图2中的广告识别方法。例如,所述计算机可读存储介质可以是只读内存Read-OnlyMemory,ROM、随机存取存储器RandomAccessMemory,RAM、只读光盘CompactDiscRead-OnlyMemory,CD-ROM、磁带、软盘和光数据存储设备等。[0157]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。[0158]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种广告识别方法,其特征在于,所述方法包括:在视频流的播放过程中,提取所述视频流的关键帧;基于识别模板,对所述关键帧的指定区域中的字符进行识别,其中,所述识别模板通过分析多个广告样本得到,且所述识别模板为一种或多种;如果所述识别模板识别出所述字符中包含数字,则确定所述视频流的类型为广告,所述数字用于指示所述视频流的剩余播放时长。2.根据权利要求1所述的方法,其特征在于,所述基于识别模板,对所述关键帧的指定区域中的字符进行识别,包括:根据所述识别模板中的字符组合规律和所述指定区域中的字符区域,确定所述字符区域中的数字区域,其中,每个字符区域仅包含一个字符;基于数字识别模型,对所述数字区域进行识别,得到所述字符所包含的数字。3.根据权利要求2所述的方法,其特征在于,所述基于识别模板,对所述关键帧的指定区域中的字符进行识别之前,所述方法还包括:截取所述关键帧的所述指定区域的图像;对所述指定区域的图像进行颜色过滤和二值化处理,得到第一图像;对所述第一图像进行膨胀处理,得到包含至少一个连通区域的第二图像;根据所述第二图像中指定位置的连通区域,对所述第一图像进行截取,得到第三图像,所述指定位置的连通区域由所述关键帧的所述指定区域中的所述字符形成;采用垂直投影算法,对所述第三图像进行分割,得到所述指定区域中的所述字符区域。4.根据权利要求1所述的方法,其特征在于,所述基于识别模板,对所述关键帧的指定区域中的字符进行识别之后,所述方法还包括:如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中已经包括最新识别模板,则确定所述视频流的类型为非广告;如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中不包括最新识别模板,则获取所述最新识别模板,基于所述最新识别模板对所述关键帧的所述指定区域中的所述字符进行识别。5.根据权利要求1所述的方法,其特征在于,所述确定所述视频流的类型为广告之后,所述方法还包括:根据识别出的所述数字,跳转到所述视频流的结尾,继续播放所述视频流的下一段视频流;或,基于所述视频流的下一段视频流的地址,下载并播放所述下一段视频流。6.—种广告识别装置,其特征在于,所述装置包括:提取模块,用于在视频流的播放过程中,提取所述视频流的关键帧;识别模块,用于基于识别模板,对所述关键帧的指定区域中的字符进行识别,其中,所述识别模板通过分析多个广告样本得到,且所述识别模板为一种或多种;确定模块,用于如果所述识别模板识别出所述字符中包含数字,则确定所述视频流的类型为广告,所述数字用于指示所述视频流的剩余播放时长。7.根据权利要求6所述的装置,其特征在于,所述识别模块,用于根据所述识别模板中的字符组合规律和所述指定区域中的字符区域,确定所述字符区域中的数字区域,每个字符区域包含一个字符;基于数字识别模型,对所述数字区域进行识别,得到所述字付所包白的数字。8.根据权利要求6所述的装置,其特征在于,所述装置还包括:所述确定模块,还用于如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中已经包括最新识别模板,则确定所述视频流的类型为非广告;获取模块,用于如果所述识别模板不能识别出所述字符中包含数字,且所述识别模板中不包括最新识别模板,则获取所述最新识别模板,基于所述最新识别模板对所述关键帧的所述指定区域中的所述字符进行识别。g•一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算^呈序处理器,用于执行存储器上所存放的计算机程序,实现权利要求1—5任一项所述的方法井’10.—种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储^:^宣程序,所述计算机程序被处理器执行时实现权利要求丨―5任一项所述的方法步骤舁1

百度查询: 海信视像科技股份有限公司 广告识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。