买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】NDN网络下可伸缩流媒体传输的动态自适应方法、设备及介质_中南大学_202210279230.0 

申请/专利权人:中南大学

申请日:2022-03-21

公开(公告)日:2023-08-08

公开(公告)号:CN114885208B

主分类号:H04N21/44

分类号:H04N21/44;H04N21/4402;H04N21/437;H04N21/2343;H04N21/239;H04N21/6405;H04N21/845;H04L45/745;H04L45/16;H04L45/02;H04L45/655;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2023.08.08#授权;2022.08.26#实质审查的生效;2022.08.09#公开

摘要:本发明公开了一种NDN网络下可伸缩流媒体传输的动态自适应方法、设备及介质,能提升视频流在NDN网络中的传输效率以及用户QoE,当热门视频对应的数据流在无线局域网下被频繁请求时,本发明通过AP利用NDN的无线组播特性一对多的向不同客户端返回数据;此外,中间节点还对传输数据进行网内缓存。从而有效减小视频数据的传输时间。通过本发明训练得到的自适应方法能使客户端在更少卡顿时间以及更小视频质量震荡的条件下,观看更高质量的视频。

主权项:1.一种NDN网络下可伸缩流媒体传输的动态自适应方法,其特征在于,包括以下步骤:步骤1,视频服务器按照现有DAS标准对视频进行分段、编码并提供MPD文件;步骤2,视频客户端首先请求MPD文件,并在收到完整MPD文件后从中获取包括视频分段、编码、质量分级数量和码率在内的信息;步骤3,当MPD文件或上一个视频块完成下载,则由神经网络根据客户端当前状态信息来作出下载新视频段的基本层或者已下载视频段的对应增强层的决策;步骤4,客户端根据决策,以兴趣包Interest的形式向服务器发送对应视频块的文件请求;步骤5,Interest在转发过程中,每经过一个包含AP在内的中间路由器即中间节点,就对中间节点的PIT表和CS表进行更新;步骤6,服务器收到客户端发来的Interest后,向客户端返回Interest对应的数据包Data,Data向下游的转发路径与Interest的上游转发路径完全相反,并且互相对应的Interest和Data的命名规则是相同的;步骤7:Data在转发的过程中,每经过一个中间节点,则也对中间节点的PIT和CS表进行更新;步骤8:客户端完整接受视频块对应的所有Data包后,计算步骤3中决策的对应奖励reward;收集经验;并更新神经网络参数:步骤9:如果所有视频段都已完成下载,则跳转到步骤1进入下一个训练回合;否则,跳转到步骤3进行后续的视频段下载决策过程;当训练的误差和回合奖励收敛后,进入步骤10;步骤10:保存神经网络对应参数;然后删除步骤8,并继续执行其他步骤,即实现NDN网络下可伸缩流媒体传输的动态自适应方法;所述的步骤3包括:3.1、收集客户端的状态信息以表征客户端当前的网络和播放缓存状况,并作为神经网络的输入;其中,bt指当前客户端的播放缓存的占用率,即已缓存视频段与播放缓存最大可缓存视频段数量的比例;zt指当前仍未下载的视频段数量;和分别表示过去n个视频块的下载速率和下载时间,表示过去n个已下载视频块的文件大小;表示播放缓存中过去n个视频段距离被播放的时间;3.2、客户端完成st的收集后,将st输入到神经网络中的前向传播,输出层的n个神经元将输出n个动作的Q值即Qs,a,从而表示在状态s执行动作a的价值优势,然后使用∈-贪婪法选择动作a:即在大部分情况下选择最大Q值对应的动作;在小概率下随机选择动作,并且随机选择动作的小概率随着智能体的训练迭代次数进一步减小;3.3、在得到一个离散的动作值a∈{0,1,…,-1}后,再将a转换为具有具体意义的下载决策:在客户端的播放缓存中动态维护一个固定大小的滑动窗口,滑动窗口大小与神经网络输出层神经元个数都为n;同时将播放缓存队列中从队头开始第一个视频质量不是最高水平的视频段编号设为x,此时,滑动窗口包含的视频段编号区间为[x,x+n;则动作a表示下载视频段x+a的对应质量层的视频块;其中神经网络的决策遵循以下模式:1当网络状况不佳时下载新视频段的基本层以减少卡顿时间;2如果视频段之间的比特率之间存在波动,则下载适当视频段的对应增强层以提升视频质量平滑度;3如果网络状况较好且已缓存视频段之间没有较大的比特率波动,则下载播放缓存最后一个视频段的对应增强层;所述的步骤4包括:基于NDN的兴趣包Interest对应数据包Data的传输模式,将文件请求拆分成若干个Interest请求并对这些Interest包进行命名;其中Interest使用以下规则命名:视频名称{视频段号}-L{质量层编号}#编号};所述的步骤5包括:更新CS表的过程包括:Interest请求每到达一个中间节点,则该中间节点会查询自身的CS表中是否缓存有该Interest请求对应的Data包:如果有,则停止该请求的向上游转发过程,直接将CS表中的缓存Data包向下游请求端返回;否则继续将请求向上游转发;更新PIT表的过程包括:中间节点上的PIT表将发送相同Interest请求的客户端维护在同一个PIT条目中:该PIT条目的键为Interest的命名,值为这些客户端的MAC地址;所述的步骤7包括:更新CS表的过程包括:将Data以LRU策略缓存到CS表中,对应CS表的条目即Data包缓存在CS表中的位置为:键位Data包的命名,值为Data包本身;更新PIT表的过程包括:找到PIT表中的键与Data包命名相同的条目,Data会朝该PIT条目下记录的下游MAC地址进行传输,同时删除Interest上传时留下的该PIT条目;在Data经过的中间节点是AP时,则在更新PIT表时包括:在删除PIT条目前,需要判断这一PIT条目下存在的MAC地址个数,即对应着网络中请求该Data包的客户端数量,若MAC地址个数等于1,该Data包在网络中以单播方式向下游发送;若MAC地址个数大于1,该Data包在网络中以组播方式向下游发送,最后删除该PIT条目;此外,AP在网络中无论是以单播还是组播方式向下游发送数据,都由AP指定数据的物理层发送速率:单播发送速率使用Interest从客户端到AP的发送速率;而组播速率选择对应无线网络协议下的最低速率;所述的步骤8包括:8.1、客户端计算这次视频块下载对应的奖励r,其中Bn为当前视频块下载完成后,对应的视频段具备的比特率;表示对应的视频段的基本层的比特率;Bn-1则是相邻的前一个视频段具备的比特率;Tn是第n个视频段下载过程中的卡顿时间;8.2、客户端迁移到新状态st′;把上一次决策时的状态st、对应动作at、奖励rt以及当前新状态st′构成的四元组st,at,rt,st′存储到用于训练的经验回放缓存D;8.3、智能体的策略调整对应神经网络的参数更新,包括经验抽样、误差计算和反向传播过程:8.3.1、经验回放缓存D中随机抽取m个样本:{si,ai,ri,si′},i=1,2,…,m;8.3.2、基于深度强化学习DDQN的两个神经网络:用于给出即时决策的当前Q网络和用于计算误差的目标Q′网络,按照以下步骤执行误差计算:1Ai′=argmaxaQsi′,a,ω;该式表示对每一个样本i,用Q网络对新状态进行前向传播,选择对应输出Q值最大的动作Ai′;其中ω表示Q网络的参数;2利用目标Q′网络计算蒙特卡洛长期收益的目标值其中ω′表示Q′网络的参数;3利用当前Q网络计算蒙特卡洛长期收益的实际值对所有样本i,计算他们和之间误差和的均方差作为误差:8.3.3、利用上述步骤计算得到的误差loss对当前Q网络进行反向传播更新其网络参数;在经过预设次数的下载决策选择后,将Q网络的参数完全复制到Q′网络。

全文数据:

权利要求:

百度查询: 中南大学 NDN网络下可伸缩流媒体传输的动态自适应方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。