【发明授权】一种AI视频处理方法与装置_之江实验室科技控股有限公司_202410017040.0

导航：龙图腾网> 最新专利技术> 一种AI视频处理方法与装置_之江实验室科技控股有限公司_202410017040.0

申请/专利权人：之江实验室科技控股有限公司

申请日：2024-01-05

公开（公告）日：2024-04-09

公开（公告）号：CN117523050B

主分类号：G06T13/40

分类号：G06T13/40;G06T13/20;G06V20/62;G06V10/86;G06V10/82;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要：本申请涉及视频处理技术领域，其具体地公开了一种AI视频处理方法与装置，其采用计算机视觉技术，对多张漫画图像进行图像语义特征提取，同时，采用自然语言处理技术，对漫画中的对话和文本描述进行文本识别，提取漫画人物的语言特征，并将两种特征进行融合，基于漫画人物的动作声音情感关联特征来分别生成相应的音频和视频，再将音频数据和视频视频结合起来以得到生成的动漫视频。这样，结合计算机视觉和自然语言处理的技术，能够更好地理解漫画人物的语言特征和漫画图像的情感表达，以生成高质量的视频。

主权项：1.一种AI视频处理方法，其特征在于，包括：获取多张漫画图像；从所述多张漫画图像中提取出动漫声音动作情感关联特征向量；基于所述动漫声音动作情感关联特征向量，生成动漫视频；其中，从所述多张漫画图像中提取出动漫声音动作情感关联特征向量，包括：对所述多张漫画图像进行图像语义理解以提取漫画全局上下文语义特征向量；对所述多张漫画图像中的文本信息进行文本语义理解以提取漫画文本语义特征向量；融合所述漫画全局上下文语义特征向量和所述漫画文本语义特征向量以得到动漫声音动作情感关联特征向量；其中，融合所述漫画全局上下文语义特征向量和所述漫画文本语义特征向量以得到动漫声音动作情感关联特征向量，包括：基于所述漫画全局上下文语义特征向量，对所述漫画文本语义特征向量进行参数化几何关系过渡先验特征的非刚性一致化以得到优化漫画文本语义特征向量；融合所述漫画全局上下文语义特征向量和所述优化漫画文本语义特征向量以得到所述动漫声音动作情感关联特征向量；其中，基于所述漫画全局上下文语义特征向量，对所述漫画文本语义特征向量进行参数化几何关系过渡先验特征的非刚性一致化以得到优化漫画文本语义特征向量，包括：以如下优化公式对所述漫画文本语义特征向量进行参数化几何关系过渡先验特征的非刚性一致化以得到所述优化漫画文本语义特征向量；其中，所述优化公式为：其中，v1表示所述漫画全局上下文语义特征向量，vj表示所述漫画全局上下文语义特征向量的第j个位置的特征值，vi表示所述漫画文本语义特征向量的第i个位置的特征值，log表示以2为底的对数函数值，λ表示预定超参数，vi′表示所述优化漫画文本语义特征向量的第i个位置的特征值；其中，对所述多张漫画图像进行图像语义理解以提取漫画全局上下文语义特征向量，包括：将所述多张漫画图像分别通过包含嵌入层的ViT模型以得到多个漫画语义特征向量；将所述多个漫画语义特征向量按照漫画顺序排列为漫画语义关联特征矩阵；将所述漫画语义关联特征矩阵通过基于卷积神经网络模型的漫画上下文关联特征提取器以得到所述漫画全局上下文语义特征向量。

全文数据：

权利要求：

百度查询：之江实验室科技控股有限公司一种AI视频处理方法与装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

下一篇：一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

相关技术

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种园林绿化便携铲_马丽丽_202322375183.2

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

AI相关技术

一种AI显卡的外置扩展装置_贵阳大数据教育实训基地有限公司_202322433336.4

一种AI头戴式计算机_瑞欧威尔(上海)智能科技有限公司_202110992003.8

虚拟场景中AI角色的行为控制方法、系统及存储介质_南京维赛客网络科技有限公司_202410214906.7

一种基于AI的RoCEv2拥塞控制方法_企商在线(北京)数据技术股份有限公司_202410064926.0

一种基于AI模型的医学影像识别方法及系统_重庆医科大学绍兴柯桥医学检验技术研究中心_202410085946.6

一种基于AI智能的地下车库灯光控制系统_启福光照明科技(上海)有限公司_202311036365.5

一种智能AI环视监控系统及使用方法_润芯微科技(江苏)有限公司_202210536740.1

一种用于物联网AI协同服务平台的智能算法和模型_新睿信智能物联研究院(南京)有限公司_202110341808.6

一种用于AI芯片的智能转运装置及其转运方法_成都芯锐科技有限公司_202211474865.2

提供AI模型的方法、AI平台、计算设备及存储介质_华为云计算技术有限公司_202311697270.8

装置相关技术

发热装置及电子雾化装置_深圳市基克纳科技有限公司_202322129414.1

液体试剂供应装置及分析装置_东亚DKK株式会社_202010736498.3

操控装置、显示装置及车辆_小米汽车科技有限公司_202320552919.6

基板处理装置和流体加热装置_东京毅力科创株式会社_202311318777.8

定影装置及图像形成装置_富士胶片商业创新有限公司_202310510018.5

输入装置_欧姆龙株式会社_201980039113.3

台架装置_北京车和家汽车科技有限公司_202322479605.0

蓄电装置_丰田自动车株式会社_202210313089.1

摄像装置_联想(北京)有限公司_202322365569.5

气囊装置_株式会社斯巴鲁_202311232048.0

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202010617172.9

通信方法及装置_华为技术有限公司_202211296381.3

信息处理方法_丰田自动车株式会社_202311358127.6

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

龙图腾网&IPTOP

【发明授权】一种AI视频处理方法与装置_之江实验室科技控股有限公司_202410017040.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务