【发明授权】一种两阶段的学术视频关键帧提取方法_石家庄铁道大学_202310626014.3

导航：龙图腾网> 最新专利技术> 一种两阶段的学术视频关键帧提取方法_石家庄铁道大学_202310626014.3

申请/专利权人：石家庄铁道大学

申请日：2023-05-30

公开（公告）日：2024-04-30

公开（公告）号：CN116740601B

主分类号：G06V20/40

分类号：G06V20/40;G06V20/62;G06V10/40;G06V10/82;G06V10/771;G06N3/045;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.30#授权;2023.09.29#实质审查的生效;2023.09.12#公开

摘要：本发明公开了一种两阶段的学术视频关键帧提取方法。该方法包括：S1，视频帧分解，按照帧率固定比例对其进行等间隔拆分，并读取场景文本图像数据集ICDAR2015；S2，构建两阶段的关键帧提取模型，将视频帧图像送入所述关键帧提取模型经Stage1和Stage2处理后得到关键帧集；S3，构建视频字幕检测模型，增加空洞卷积和压缩激励模块改进特征提取层，并动态更新学习率优化路由算法，训练所述视频字幕检测模型；S4，构建关键帧集提取算法，引入自适应时空采样线，测试关键帧集提取算法；S5，利用S3和S4训练测试所得的关键帧提取模型对输入视频执行上述S1和S2，根据字幕帧存在阈值区间生成关键帧集合。该方法能够充分利用视频的多模态信息，具有更好的鲁棒性和普适性，且关键帧提取更加精准，满足用户的现实需求。

主权项：1.一种两阶段的学术视频关键帧提取方法，其特征在于，包括如下步骤：S1：视频帧分解，按照帧率固定比例对其进行等间隔拆分，并读取场景文本图像数据集；S2，构建两阶段的关键帧提取模型，将视频帧图像送入所述关键帧提取模型经Stage1模块和Stage2模块处理后得到关键帧集，所述关键帧提取模型包括：Stage1模块，所述Stage1模块以场景文本图像数据集为数据来源扩充数据集，该阶段首次搭建以胶囊网络CapsNet为基础的学术视频字幕检测模型，并引入软池化、空洞卷积以及压缩激励模块来完成特征增强和特征筛选，使网络能够学习到更丰富的图像特征，以完成学术视频字幕的检测和定位；Stage2模块，所述Stage2模块以Stage1的处理结果为输入，构建时空字幕自适应采样线，利用学术视频字幕边界坐标获取更多样的学术视频时空字幕采样，以得到更具代表性的字幕累积统计值；S3，构建视频字幕检测模型进行字幕检测，包括：将所述场景文本图像数据集，通过堆叠的空洞卷积层来进行特征增强，以得到卷积特征图；将所述卷积特征图，通过压缩激励模块进行全局平均池化和全连接操作来完成特征筛选，以得到改善的特征表示；将改善的特征表示，通过胶囊层和自适应矩估计下的路由算法来完成字幕检测，最后输出字幕区的8值坐标点；S4，构建关键帧集提取算法，利用字幕边界坐标迭代进行学术视频自适应时空采样线的选取，并以此构建自适应时空累积，最后利用Flag双值标定完成学术视频的关键帧集提取；S5，利用S3和S4训练测试所得的关键帧提取模型对输入视频执行上述S1和S2，根据学术视频时空字幕像素累积值标定字幕帧阈值区间，进而获得关键帧集合。

全文数据：

权利要求：

百度查询：石家庄铁道大学一种两阶段的学术视频关键帧提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于云服务的远程教育资源管理方法_茂名市丰茂教育科技有限公司_202410313550.2

下一篇：一种基于安全帽的智能巡检系统_大唐(赤峰)新能源有限公司_202311363203.2

相关技术

一种基于云服务的远程教育资源管理方法_茂名市丰茂教育科技有限公司_202410313550.2

一种基于安全帽的智能巡检系统_大唐(赤峰)新能源有限公司_202311363203.2

渲染方法、装置、服务器、存储介质及程序产品_北京达佳互联信息技术有限公司_202111600010.5

用于磁共振成像的磁场均匀性测量的数据记录和处理方法_上海辰光医疗科技股份有限公司_202011332755.3

一种数字孪生智慧城市交通的虚拟红绿灯控制提醒方法_福建工程学院_202210058268.5

一种基于强化学习的水下机器人避障路径规划方法_大连理工大学_202210236892.X

一种显示面板、制程方法及显示装置_深圳市华星光电半导体显示技术有限公司_202011251693.3

一种指尖配戴式智能书写装置_华北水利水电大学_202210433248.1

一种基于时频资源的NB-IoT容量估算方法_江西省邮电规划设计院有限公司_202111393875.9

数据传输系统_安世有限公司_202311578181.1

一种高层业务类型检测方法及装置_山东闻远通信技术有限公司_202210591789.7

基于数据标签技术的FPGA外置大容量存储器多端口访问系统_中国科学院长春光学精密机械与物理研究所_202410254378.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种两阶段的学术视频关键帧提取方法_石家庄铁道大学_202310626014.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务