买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于反思网络的教学场景视频描述生成方法_杭州义顺科技有限公司;南京众智未来人工智能研究院有限公司_202011483140.0 

申请/专利权人:杭州义顺科技有限公司;南京众智未来人工智能研究院有限公司

申请日:2020-12-15

公开(公告)日:2021-03-19

公开(公告)号:CN112528883A

主分类号:G06K9/00(20060101)

分类号:G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06F40/126(20200101);G06F40/151(20200101)

优先权:

专利状态码:失效-发明专利申请公布后的撤回

法律状态:2023.02.28#发明专利申请公布后的撤回;2021.04.06#实质审查的生效;2021.03.19#公开

摘要:本发明公开了一种基于反思网络的教学场景视频描述生成方法,包括如下步骤:步骤1视频图像预处理阶段;步骤2图像特征抽取阶段;步骤3数据集标注预处理阶段;步骤4图像特征编码阶段;步骤5文本解码阶段。本发明具有的有益效果是:是能够很好地针对常见教学视频生成高质量、精细化的描述性句子。提出将反思网络应用于教学场景的视频描述任务,使得网络通过一个两阶段解码器的反思过程,就可在序列解码过程中同时检查前后的内容,从而可以利用全局信息生成描述。

主权项:1.一种基于反思网络的教学场景视频描述生成方法,其特征在于,包括如下步骤:步骤1视频图像预处理阶段:对视频抽取指定个数的图像帧,并对图像做颜色、尺寸变换的预处理;步骤2图像特征抽取阶段:使用预训练卷积神经网络抽取图像帧特征并保存;步骤3数据集标注预处理阶段:提出一个包含教学场景视频的新数据集,每个视频对应一条手工标注的语句,用来描述师生课堂的互动情况;根据已标注的所有文本建立词汇表;最后将所有由人类语言标注的句子根据词汇表中的对应关系转成数字序号序列;步骤4图像特征编码阶段:使用门控循环单元网络GRU,对于步骤2中已保存的图像帧特征进行编码,得到视觉表征序列;步骤5文本解码阶段:使用两阶段反思解码器,第一阶段解码器用于解码生成原始语句序列,第二阶段解码器通过反思的过程打磨和润色原始语句;两个解码器将步骤4得到的视觉表征序列解码为数字序号序列;然后根据词汇表中单词与数字的对应关系将数字序号序列转为文本句子。

全文数据:

权利要求:

百度查询: 杭州义顺科技有限公司;南京众智未来人工智能研究院有限公司 一种基于反思网络的教学场景视频描述生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。