买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于生成对抗网络的视频密集事件描述方法_华中科技大学_202010296654.9 

申请/专利权人:华中科技大学

申请日:2020-04-15

公开(公告)日:2020-07-03

公开(公告)号:CN111368142A

主分类号:G06F16/78(20190101)

分类号:G06F16/78(20190101);G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:有效-授权

法律状态:2023.06.06#授权;2020.07.28#实质审查的生效;2020.07.03#公开

摘要:本发明公开了一种基于生成对抗网络的视频密集事件描述方法,属于深度学习和图像识别领域。包括:构建视频密集事件描述网络;该网络包括:视频特征提取模块,对视频帧进行特征提取,得到视频帧特征;时序动作特征提取模块,利用视频前向传播与反向传播的特点进行视频帧特征学习,得到各个时序动作特征;自然语言编码器,利用注意力机制融合视频帧特征与时序动作特征,得到自然语句;鉴别器,强化自然语句的准确性;利用训练好的视频密集事件描述模型进行视频密集事件描述。本发明充分考虑了视频双向传播的特点,同时学习自然语句生成时充分利用了视频特征及时序动作特征,并构建语法鉴别器与内容鉴别器,有效强化了自然语句准确性。

主权项:1.一种基于生成对抗网络的视频密集事件描述方法,其特征在于,包括:S1.构建视频密集事件描述网络;所述视频动作描述网络包括:视频特征提取模块、时序动作特征提取模块、自然语言编码器和鉴别器;所述视频特征提取模块,用于对输入视频进行帧提取,并对提取到的视频帧进行特征提取,得到视频帧特征;所述时序动作特征提取模块,用于利用视频前向传播与反向传播的特点进行视频帧特征学习,得到各个时序动作特征;所述自然语言编码器,用于利用注意力机制融合视频帧特征与时序动作特征,得到自然语句;所述鉴别器,用于强化自然语句的准确性;S2.对所述视频密集事件描述网络进行迭代训练,得到训练好的视频密集事件描述模型;S3.将待描述的视频输入训练好的视频密集事件描述模型,得到视频密集事件描述结果。

全文数据:

权利要求:

百度查询: 华中科技大学 一种基于生成对抗网络的视频密集事件描述方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。