申请/专利权人:北京达佳互联信息技术有限公司;山东大学
申请日:2021-08-09
公开(公告)日:2024-03-19
公开(公告)号:CN113590881B
主分类号:G06F16/783
分类号:G06F16/783;G06V20/40;G06V10/74;G06V10/82;G06N3/0464;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2024.03.19#授权;2021.11.19#实质审查的生效;2021.11.02#公开
摘要:本公开关于一种视频片段检索方法、视频片段检索模型的训练方法、装置、电子设备及存储介质,该方法包括:获取待查询视频的视频特征和检索文本的文本特征;将视频特征和文本特征输入预先训练的视频片段检索模型,得到待查询视频中与检索文本匹配的候选视频片段;其中,预先训练的视频片段检索模型,为根据样本视频、样本文本以及与样本文本匹配的目标候选视频片段对待训练的视频片段检索模型进行训练得到的;其中,目标候选视频片段从候选样本视频片段库中获取,候选样本视频片段库中包括按照多种时长划分标准对样本视频进行划分得到的多组候选样本视频片段。采用本方法,有利于提高得到的目标视频片段的准确率。
主权项:1.一种视频片段检索方法,其特征在于,所述方法包括:获取待查询视频的视频特征和检索文本的文本特征;将所述视频特征和所述文本特征输入预先训练的视频片段检索模型,得到所述待查询视频中与所述检索文本匹配的候选视频片段;其中,所述预先训练的视频片段检索模型,为根据样本视频、样本文本以及与所述样本文本匹配的目标候选视频片段对待训练的视频片段检索模型进行训练得到的;其中,所述目标候选视频片段从候选样本视频片段库中获取,所述候选样本视频片段库中包括按照多种时长划分标准对所述样本视频进行划分得到的多组候选样本视频片段,其中,每组候选样本视频片段中包括采用一种时长划分标准对所述样本视频进行划分得到的多个候选样本视频片段;不同组候选样本视频片段之间采用的时长划分标准不同;所述预先训练的视频片段检索模型通过下述方式训练得到:获取样本视频的样本视频特征和样本文本的样本文本特征;将所述样本视频特征和所述样本文本特征输入待训练的视频片段检索模型,得到所述样本视频的各候选样本视频片段与所述样本文本之间的匹配度情况;通过所述待训练的视频片段检索模型,得到所述各候选样本视频片段的时间信息;所述时间信息包括对应的候选样本视频片段的开始时间和结束时间;获取所述各候选样本视频片段中,任意两个候选样本视频片段的时间信息之间的时序交并比;根据所述匹配度情况和所述时序交并比,得到各候选样本视频片段与所述样本文本之间的目标匹配度情况;从所述各候选样本视频片段中筛选出所述目标匹配度情况最大的候选样本视频片段,作为与所述样本文本匹配的目标候选视频片段;根据所述目标候选视频片段与所述样本文本之间的匹配度情况确定损失值,根据所述损失值对所述待训练的视频片段检索模型进行训练,得到训练完成的视频片段检索模型。
全文数据:
权利要求:
百度查询: 北京达佳互联信息技术有限公司;山东大学 视频片段检索方法、视频片段检索模型的训练方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。