【发明授权】基于视觉与主题协同注意力的连贯性故事生成系统及方法_同济大学_202110931513.4

导航：龙图腾网> 最新专利技术> 基于视觉与主题协同注意力的连贯性故事生成系统及方法_同济大学_202110931513.4

申请/专利权人：同济大学

申请日：2021-08-13

公开（公告）日：2024-01-23

公开（公告）号：CN113779938B

主分类号：G06F40/166

分类号：G06F40/166;G06F40/216;G06F16/35;G06V10/77;G06N3/0442;G06N3/0475;G06N3/0455;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.01.23#授权;2021.12.28#实质审查的生效;2021.12.10#公开

摘要：本发明涉及一种基于视觉与主题协同注意力的连贯性故事生成系统及方法，该方法包括以下步骤：1提取相册特征向量以及时间动态信息；2获取每条描述语句的主题概率分布并预测相册中每幅图像中的主题分布信息；3基于视觉与主题协同注意力生成主题连贯性的图像描述语句；4通过考虑n‑gram多样性的短语束搜索算法对图像描述语句进行短语束搜索，提高视觉故事叙述表达的准确度和多样性。与现有技术相比，本发明具有增强描述语句的主题连贯性、提高故事本文的表达多样性、优化视觉故事的生成质量等优点。

主权项：1.一种基于视觉与主题协同注意力的连贯性故事生成系统，其特征在于，该系统包括：图像相册特征编码模块：用以提取相册特征向量以及时间动态信息；主题感知模块：由故事描述文本主题挖掘模型和主题分布预测模型构成，用以获取每条描述语句的主题概率分布并预测相册中每幅图像中的主题分布信息；视觉与主题协同注意力模块：分别与图像相册特征编码模块和主题感知模块连接，用以基于视觉与主题协同注意力生成主题连贯性的图像描述语句；所述的视觉与主题协同注意力模块包括基于GRU的自上而下视觉注意力模型、基于GRU的自上而下主题注意力模型以及分别与视觉与主题协同注意力模块包括基于GRU的自上而下视觉注意力模型和基于GRU的自上而下主题注意力模型连接的连贯性语句生成模型组成；所述的基于GRU的自上而下视觉注意力模型以上一个时间步的隐状态、图像相册视觉编码信息以及在当前时间步前已经生成的单词Weχt-1作为输入，以视觉权重分布和当前时间步的隐状态作为输出，具体为：其中，θj,t为时间步t图像相册j的时间动态信息的正则化注意力权重，tanh·表示双曲正切函数，Wv和Wa为转换矩阵，表示向量连接运算符，为基于GRU的自上而下视觉注意力模型在时间步t-1时第j个相册特征的隐状态，为权重参数，为第j个相册在时间步t的视觉权重分布，softmax·为归一化指数函数，We为大小为Ω的词汇表单词嵌入矩阵，χt-1为输入单词在时间步t-1的独热编码；所述的基于GRU的自上而下主题注意力模型自上而下的主题注意力GRU模型的上一个时间步的隐状态、相册中每一幅图像的主题概率分布和主题预测分布以及在当前时间步前已经生成的单词Weχt-1作为输入，以主题权重分布和当前时间步的隐状态作为输出，具体为：其中，bj,t为时间步t图像相册特征的正则化注意力权重，Wd和Wc为转换矩阵，为基于GRU的自上而下主题注意力模型在时间步t-1时第j个相册特征的隐状态，为权重参数，为第j个相册在时间步t的主题权重分布，为第j个相册在时间步t的主题概率分布；所述的连贯性语句生成模型以视觉权重分布主题权重分布时间步t第j个相册特征的隐状态作为输入，生成主题连贯性的图像描述语句，所述的连贯性语句生成模型的表达式为：其中，表示连贯性语句生成模型GRUlan的输入，表示连贯性语句生成模型GRUlan模型中第j个相册在时间步t的隐状态，Wp和bp分别为连贯性语句生成模型的学习参数和偏差，pyj,t为第j个相册在时间步t生成单词yj,t的概率分布。

全文数据：

权利要求：

百度查询：同济大学基于视觉与主题协同注意力的连贯性故事生成系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：数据传输方法、装置以及系统_华为技术有限公司_202180102041.X

下一篇：信号处理系统、信号处理方法以及信号处理程序_旭化成微电子株式会社_202280060263.4

相关技术

数据传输方法、装置以及系统_华为技术有限公司_202180102041.X

信号处理系统、信号处理方法以及信号处理程序_旭化成微电子株式会社_202280060263.4

基于多源传感器数据融合的预测方法、装置和存储介质_福州城投新基建集团有限公司_202410119428.1

触摸轨迹确定方法、装置、设备及介质_青岛海信商用显示股份有限公司_202211255349.0

一种从沉积型黏土锂矿中综合回收锂、硅、铝的方法_中南大学_202410120181.5

一种煤矿园区的管控方法和管控系统_宁波长壁流体动力科技有限公司_202410338009.7

一种利用滇黄精薄层细胞的组织培养方法及其应用_中国科学院昆明植物研究所_202410024960.5

一种预制花瓶墩模板吊装装置及吊装方法_云南渝霖模板制造有限公司_202410341063.7

资源分配模型的矫正方法及装置、存储介质、电子设备_中博信征信有限公司_202410115695.1

一种产五种类型西红花苷的大肠杆菌工程菌及其应用_安徽医科大学_202410059069.5

一种离子通道药物筛选系统_李梦菡_202310321842.6

一种2，5-二溴对苯二甲酸二乙酯复合TiO₂·H₂O的制备方法及应用_贵州大学_202410041534.2

连贯性相关技术

密封性接头_苏州可靠精密五金有限公司_202322416331.0

吸收性物品_爱适瑞卫生健康产品有限公司_202280060655.0

耐磨性检测设备_箭牌家居集团股份有限公司_202410145327.1

治疗绝经后非酒精性脂肪性肝病的中药及其制备方法_河南中医药大学第一附属医院_202311796443.1

电剥离性粘合剂组合物、电剥离性粘合制品及其剥离方法_维爱吉科技有限公司_202180002711.0

可靠性测试装置及可靠性测试方法_长鑫存储技术有限公司_202211259936.7

移动性鲁棒性优化方法、装置及存储介质_OPPO广东移动通信有限公司_202180101841.X

结节性痒疹的治疗_高德美控股有限公司_202280041068.7

耐高温糖响应性凝胶_国立大学法人东海国立大学机构_201980037079.6

一次性导电吸头_安徽圣谦生物科技有限公司_202322299693.6

注意力相关技术

基于注意力确定的会议会话控制_索尼集团公司_202380013497.8

一种基于注意力网络的代码修复方法_大连海事大学_202210456344.8

一种基于注意力的多兴趣序列推荐方法及系统_北京工业大学_202111567320.1

基于多注意力的模型训练方法、系统、设备及存储介质_芜湖云从科技有限公司_202410102137.1

基于注意力监督调整的玻璃容器缺陷检测方法及系统_山东山科数字经济研究院有限公司_202410338088.1

融合注意力机制的心率变异性压力检测方法及相关组件_佛山需要智能机器人有限公司_202410323333.1

一种基于自注意力机制的预训练模型去偏方法_湖南科技大学_202311796530.7

一种目标检测中使用IoU加强自注意力机制的方法_华东师范大学_202210072743.4

基于注意力机制流网络的流体灾害检测预警平台_兰州大方电子有限责任公司_202311529888.3

一种融合混合注意力的显著性目标检测方法_盐城工学院_202310290079.5

故事相关技术

八大行星故事机_南京万德体育产业集团有限公司_202322237098.X

油气勘探开发生产事故事件数据处理方法、装置及设备_中国石油化工集团有限公司_202311719444.6

一种基于文本描述的轨迹故事叙述可视化自动生成方法_北京大学_202311710233.6

一种故事质量自动评估方法_叙之科技(杭州)有限公司_202410065509.8

交互式故事绘本生成方法、装置、电子设备及存储介质_科大讯飞股份有限公司_202311829372.0

一种基于AI个性化故事系统和互动故事视频生成方法_华数传媒网络有限公司_202311636841.7

一种基于多源异构特征融合的可控故事生成方法_江南大学_202311828251.4

通过基于故事的问答式评估和基于故事的语音提取来诊断痴呆症的方法及系统_伊莫克有限公司_202280053587.5

一种基于外部知识增强的故事生成方法及系统_北京大学_202211159343.3

一种事故事件快速维护方法及系统_华能济南黄台发电有限公司_202311575665.0

龙图腾网&IPTOP

【发明授权】基于视觉与主题协同注意力的连贯性故事生成系统及方法_同济大学_202110931513.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务