买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】自动媒体信息播放方法_北京创业未来传媒技术有限公司_201810030761.X 

申请/专利权人:北京创业未来传媒技术有限公司

申请日:2018-01-12

公开(公告)日:2020-11-24

公开(公告)号:CN108289245B

主分类号:H04N21/439(20110101)

分类号:H04N21/439(20110101);H04N21/437(20110101);H04N21/431(20110101);H04N21/232(20110101);H04N21/845(20110101);G10L25/51(20130101)

优先权:

专利状态码:有效-授权

法律状态:2020.11.24#授权;2018.08.10#实质审查的生效;2018.07.17#公开

摘要:本公开关于一种自动媒体信息播放方法,包括接收包括第一频率范围和第二频率范围的音频注释信息,通过带通滤波从第二频率范围中提取特征标识声音,并在特征标识声音满足预定条件时将其发送到远程服务器以便获取相关联的视频数据。该方法有助于在不改变留存设备的情况下实现传统场馆展示功能的智能化。

主权项:1.一种自动媒体信息播放方法,所述方法由用户终端执行,其特征在于包括:接收来自多个外部播放源之一的音频注释信息,所述音频注释信息包括第一频率范围的声音和高于所述第一频率的第二频率范围的声音,所述第一频率范围的声音由在时间上不连续的多个第一时间段组成,所述第二频率范围的声音由时间上分布在相邻两个第一时间段之间的多个第二时间段组成,且属于相同外部播放源的每个第二时间段中包括相同的特征标识声音;对所述音频注释信息进行使得所述第二频率范围的至少一部分通过的带通滤波以识别是否存在特征标识声音;在一个预设时间周期内相同的特征标识声音被识别的次数超过该预设时间周期内预设的次数阈值的情况下将该特征标识声音通过无线网络发送到远程服务器;以及从远程服务器接收与所识别的特征标识声音关联的视频注释信息。

全文数据:自动媒体信息播放方法技术领域[0001]本公开属于音频和视频播放领域,更具体地关于一种自动媒体信息播放方法。背景技术[0002]在博物馆、美术馆、旅游景点、博览会、产品演示会等向来访者展示物品或特定地点的场合,一般配备有自助语音解说装置以便节省为来访者进行介绍的人力物力。例如,在美术馆中的画作一般标记有特定的数字标记,游客可以在便携式或固定式的解说机上输入该数字标记以便得到关于该画作的解说信息。在博览会上可能会在每个产品附近配置固定的播放装置,以便持续为感兴趣的游客提供产品信息。但是仅仅播放语音信息可能无法越来越难以使游客得到满意的体验,游客可能会要求与展品有关的图片、视频、增强现实放映、互动游戏等其他类型的媒体信息。这些其他类型的媒体信息需要将传统的语音解说装置进行智能化,配置显示屏幕、网络功能和触摸屏等才能实现。因此目前场馆方一般会升级旧的解说系统,并且向到访的每个游客租借额外的手机,平板电脑等智能装置来播放音频以外类型的媒体信息。对于场馆方来说,提供手机、平板电脑增加了运营成本,比起传统解说机更容易出现故障、损坏和丢失。对于游客来说,这些设备可能需要付出比传统的解说机更高的租借费用,而且尺寸也远大于传统解说机难以携带。虽然游客持有自用的手机或平板电脑,但一是利用自用设备查找媒体信息需要繁琐的登录、检索、下载等步骤会影响用户体验,二是场馆中的媒体信息一般为版权持有方希望专门为场馆内游客提供而不希望在互联网上公开供人自由查阅。因此,有必要提供一种新方法,使得在利用传统语音解说装置的前提下,每个用户自用的手机或平板电脑能够快速自动查找并播放与展品相关的媒体信息,且该媒体信息不会对观看展品的用户以外的人可见。发明内容[0003]本公开的目的之一是解决现有技术中的上述问题,并提供一种在场馆中针对不同展品自动播放媒体信息的方法。[0004]本文公开了一种自动媒体信息播放方法,该方法由用户终端执行,包括接收来自多个外部播放源之一的音频注释信息,该音频注释信息包括第一频率范围的声音和高于第一频率的第二频率范围的声音,第一频率范围的声音由在时间上不连续的多个第一时间段组成,第二频率范围的声音由时间上分布在相邻两个第一时间段之间的多个第二时间段组成,且相同外部播放源的每个第二时间段中包括相同的特征标识声音,对音频注释信息进行使得第二频率范围的至少一部分通过的带通滤波以识别是否存在特征标识声音,在一个预设时间周期内相同的特征标识声音被识别的次数超过预设的次数阈值时将该特征标识声音通过无线网络发送到远程服务器,以及从远程服务器接收与所识别的特征标识声音关联的视频注释信息。[0005]上述方案可以用于传统解说机,通过对解说信息的空白部分编码入高频段的标识信息,在不影响用户收听的情况下可对每件展品标注不同的特征识别信息。场馆中设置的远程服务器根据该特征识别信息的接收情况的变化判断用户位于哪件展品附近,并自动向用户终端传送相对应的视觉媒体信息,从而可以较低的成本和更高的效率实现多媒体信息播放。[0006]在一些实施例中,至少一个第一时间段的时间长度与其他第一时间段的时间长度不同。[0007]在一些实施例中,每个第二时间段的时间长度相同。[0008]在一些实施例中,视频注释信息包括图片、影像、文字中的至少一种以用于在用户终端上向用户呈现。[0009]在一些实施例中,在预设时间内接收到多个不同的特征标识声音时,将被识别的次数最多且超过预设的次数阈值的特征标识声音通过无线网络发送到远程服务器。[0010]在一些实施例中,第一频率范围为20HZ-16KHZ。[0011]在一些实施例中,第二频率范围为18KHz-20KHz。[0012]在一些实施例中,在一个预设时间周期内要发送到远程服务器的特征标识声音与上一次所发送特征识别声音不同时,中止当前呈现的视频注释信息。[0013]在一些实施例中,在一个预设时间周期内要发送到远程服务器的特征标识声音与上一次所发送特征识别声音相同时,继续当前呈现的视频注释信息。[0014]在一些实施例中,在预设时间内接收到多个不同的特征标识声音时,将被识别的次数超过预设的次数阈值声音强度最大的特征标识声音通过无线网络发送到远程服务器。[0015]在一些实施例中,远程服务器存储有不同特征标识声音与对应视频注释信息的映射关系表。[0016]在一些实施例中,根据所识别的多个特征标识声音之间的时间间隔将视频注释信息与音频注释信息同步。[0017]本公开的实施例有助于实现自动判断参观者正在观察的展品,并及时向参观者推送与之相关的媒体信息,因此节省了升级或增加场馆设施所造成的成本,并省略了参观者的手动操作从而提供更高的用户体验。附图说明[0018]本竺开提供了附图以便于进一步理解所公开的内容,附图图示出体现本发明概念的非限制性示例,而不是用于做出任何限制。[0019]图1是根据本公开一些实施例的媒体信息播放方法的流程图。具体实施方式、[0020L本领域技术人员将理解尽管术语第一、第二等可在本文中用于描述各种元素,但这些元素不应由这些术语限制。这些术语仅用于将各种元素彼此区分开。图1是根据一些实施例的媒体信息播放方法的流程图。例如在博物馆、美术馆等场会租借各种语言_讎置,_了解铺1艺术娜龍信息或详细解的讲解装置—般为音频纖器,仅包括扬声器和键盘。用户通过键盘输入与关码,讲解装麵之播放与该代码有关的录音,但无法提供视频信息。在步骤中’用户的移动终端接收来自多个外部纖源之—的音频注释信息。多个外部撇源可以是对应于多个不同艺术品的多个独立的播放器,也可以是对应于多个不同艺术品的同一个播放器所播放的不同音频。优选地,可以事先控制播放器的音量以便所播放的关于一件艺术品的音频注释信息在传播到另一件附近艺术品时已经被衰减到环境噪声的等级,因声音强度随着传播距离的平方衰减,这是容易实现的。该音频注释信息包括第一频率范围的声音和高于第一频率的第二频率范围的声音,第一频率范围的声音由在时间上不连续的多个第一时间段组成,第二频率范围的声音由时间上分布在相邻两个第一时间段之间的多个第二时间段组成。第一时间段内的声音可以包括对艺术品的解说语音,用于向用户进行播放。由于解说语音的词组、短语、句子或段落之间必然会存在一定时间间隔,可以例如将第二时间段布置在这些时间间隔之内。这些第二时间段可以用于编码解说语音之外的识别信息。因词组、短语、句子或段落的时间长度一般不一致,因此不会出现每个第一时间段的时间长度都相同的情况。第二时间段因为编码有识别信息,优选地对于同一播放源或者同一展品均具有相同的时间长度以便识别。因此,两两相邻第二时间段之间间隔的第一时间段的时间长度将具有区别,该区别对于每个所播放的不同解说音频也是不同的,可以用于后续视频媒体与音频媒体播放的同步。例如,通过第二时间段之间间隔的时长,可以估计音频媒体当前播放的进度。如果视频媒体是用于配合音频媒体使用,则可以根据音频媒体播放的进度调整到对应的进度进行播放。这些第一频率范围例如为20Hz-16KHz以便用户可以知觉。第二频率范围例如为18KHz-20KHz可以使几乎所有用户无法知觉,且仍处于现有智能移动终端所配备麦克风可以接收的频率范围。[0022]在步骤S102中,对音频注释信息进行使得第二频率范围的至少一部分通过的带通滤波以识别是否存在特征标识声音。在一个实施例中,该带通滤波可以通过对接收的声音信息进行模数转换,并通过FFT、DFT频谱分析等现有技术将18KHz以下和20KHz以上的频率滤除或将其权重改为零而实现。经过带通滤波后,所保留的为可能包括特征标识声音的频率范围,这样便于进行特征标识声音的识别。特征标识声音的频率可以是该范围中的进一步的连续范围或离散值。用户终端可以通过频率范围、时长、波形特性之中的任意特征与预设的判断条件是否吻合来判断是否存在特征识别声音,也可以直接通过解调得到例如通过变频编码在第二频率范围信号波形之中的特征识别声音信号,还可以直接调用用户终端中一般内置的语音识别模块如Siri等进行识别。[0023]在步骤S103中,如果一个预设时间周期内相同的特征标识声音被识别的次数超过预设的次数阈值,则将该特征标识声音通过无线网络发送到远程服务器,并从远程服务器接收与所识别的特征标识声音关联的视频注释信息。该视频注释信息包括图片、影像、文字中的至少一种以用于在用户终端上向用户呈现。视频注释信息即可以用于与音频注释信息配合使用,也可以用于提供背景介绍或互动游戏等额外服务。该预设时间周期可以根据展品的种类和参观者游览的平均时间而预先设置。随着参观者靠近特定的展品,参观者携带的讲解装置或者展品附近的播放器将开始播放与该展品有关的音频注释信息,用户所持有的用户终端也将开始接收到该音频注释信息。因用户会在场馆内随机走动且参观的展品也是随机的,用户终端所接收到的音频注释信息可能不断变化,其中包含的特征标识声音也会时刻变化。为了更准确地判断所识别的特征标识声音是否能对于用户正在观看的展品,设置一个在该预设时间周期内的识别次数阈值。该预设时间周期和次数阈值可以根据场馆和展品的具体类型来确定。例如,在5秒钟的时间之内如果识别到超过10次,可以指示用户在展品附近停留较久,需要与该展品相关的视频伯息。而若不设置次数阈值,而是识别到特征标识声音后仅请求视频信息,则容易在用户快速移动时造成不必要的困扰。用户终端将识别次数超过次数阈值的特征标识声音通过无线网络发送到远程服务器,并且从并远程服务器接收与该特征标识声音关联的视频注释信息。远程服务器可设置在场馆内,通过例如IEEE802•11等标准与用户终端进行通讯。远程服务器存储有所有展品的视频注释信息以及不同特征标识声音与对应视频注释信息的映射关系表。可以在映射关系表中存储特征标识声音信号的时间、频率、波形等特征与视频注释信息的一一对应关系,也可以利用从特征标识声音解调得到的声音信号作为关键词在映射关系表中查找。远程服务器中相对应的视频注释信息随之发送到用户终端用于向参观者进行播放。[0024]如果有多个播放源同时播放,在预设时间内可能接收到多个不同的特征标识声音,则将被识别的次数最多且超过次数阈值的特征标识声音通过无线网络发送到远程服务器。也可以通过多个特征标识声音的相对音量大小来估计每个特征标识声音距离用户终端的相对距离,并且将相对音量最大因而距离最近的特征标识声音发送到远程服务器。该相对音量可以是每次识别所检测到音量的平均值。若预设时间周期内要发送到远程服务器的特征标识声音与上一次所发送特征识别声音不同,则表明参观者移动到其他的展品处进行观看,此时应中止当前呈现的视频注释信息,并开始接收新的视频媒体。若预设时间周期内要发送到所述远程服务器的特征标识声音与上一次所发送特征识别声音相同时,则说明参观者仍在当前展品附近参观,因此继续当前呈现的视频注释信息。[0025]本领域技术人员将理解其他符合本公开范围的变形也在本发明概念和原则的范围内。

权利要求:1.一种自动媒体信息播放方法,所述方法由用户终端执行,其特征在于包括:接收来自多个外部播放源之一的音频注释信息,所述音频注释信息包括第一频率范围的声音和高于所述第一频率的第二频率范围的声音,所述第一频率范围的声音由在时间上不连续的多个第一时间段组成,所述第二频率范围的声音由时间上分布在相邻两个第一时间段之间的多个第二时间段组成,且属于相同外部播放源的每个第二时间段中包括相同的特征标识声音;对所述音频注释信息进行使得所述第二频率范围的至少一部分通过的带通滤波以识别是否存在特征标识声音;在一个预设时间周期内相同的特征标识声音被识别的次数超过预设的次数阈值时将该特征标识声音通过无线网络发送到远程服务器;以及从远程服务器接收与所识别的特征标识声音关联的视频注释信息。2.权利要求1所述的方法,其特征在于至少一个第一时间段的时间长度与其他第一时间段的时间长度不同。3.权利要求2所述的方法,其特征在于每个第二时间段的时间长度相同。4.权利要求3所述的方法,其特征在于所述视频注释信息包括图片、影像、文字中的至少一种以用于在用户终端上向用户呈现。5.权利要求4所述的方法,其特征在于还包括在所述预设时间内接收到多个不同的特征标识声音时,将被识别的次数最多且超过所述预设的次数阈值的特征标识声音通过无线网络发送到远程服务器。6.权利要求5所述的方法,其特征在于所述第一频率范围为20Hz-16KHz。7.权利要求6所述的方法,其特征在于所述第二频率范围为18KHz-20KHz。8.权利要求7所述的方法,其特征在于还包括在一个预设时间周期内要发送到所述远程服务器的特征标识声音与上一次所发送特征识别声音不同时,中止当前呈现的视频注释信息。9.权利要求4所述的方法,其特征在于还包括在所述预设时间内接收到多个不同的特征标识声音时,将被识别的次数超过所述预设的次数阈值声音强度最大的特征标识声音通过无线网络发送到远程服务器。10.权利要求9所述的方法,其特征在于所述远程服务器存储有不同特征标识声音与对应视频注释信息的映射关系表。

百度查询: 北京创业未来传媒技术有限公司 自动媒体信息播放方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。