【发明公布】一种基于语言大模型的可解释性图像美学情感预测方法_西北大学_202410057047.5

导航：龙图腾网> 最新专利技术> 一种基于语言大模型的可解释性图像美学情感预测方法_西北大学_202410057047.5

申请/专利权人：西北大学

申请日：2024-01-15

公开（公告）日：2024-05-17

公开（公告）号：CN118052771A

主分类号：G06T7/00

分类号：G06T7/00;G06N3/0455;G06N3/084;G06N5/045;G06F18/25;G06F40/284;G06V10/44

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本发明公开了一种基于语言大模型的可解释性图像美学情感预测方法：步骤1，获取美学数据集，对美学数据集进行数据清洗和预处理，获得每张图片的图像ID、文本描述信息和美学质量评分信息；步骤2，构建图像美学可解释性模型，该模型包括视觉特征提取模块、提示文本特征提取模块、文本‑视觉融合模块、美学情感特征提取模块、美学自适应模块和美学描述生成解码模块；步骤3采用训集对图像美学可解释模型进行训练，得到训练好的图像美学可解释模型。步骤4，将待测的图像输入步骤3得到的训练好的图像美学可解释模型，得到输出结果。本发明解决有效地提高了美学可解释性的能力。

主权项：1.一种基于语言大模型的可解释性图像美学情感预测方法，其特征在于，包括以下步骤：步骤1，获取美学数据集，对美学数据集进行数据清洗和预处理，获得每张图片的图像ID、文本描述信息和美学质量评分信息；步骤2，构建图像美学可解释性模型，该模型包括视觉特征提取模块、提示文本特征提取模块、文本-视觉融合模块、美学情感特征提取模块、美学自适应模块和美学描述生成解码模块；所述的视觉特征提取模块用于提取步骤1中处理的美学数据集中的图像的视觉特征；所述的提示文本特征提取模块用于提取Prompt的相关文本特征；所述的文本-视觉融合模块用于将提示文本特征提取模块提取的相关文本特征和视觉特征提取模块提取出的图像的视觉特征进行对应融合，得到关于Prompt提示文本的图像特征；所述的美学情感特征提取模块用于作为美学情感特征提取空间，将视觉特征提取模块提取出的图像的视觉特征进行处理获得有关美学和情感的特征；所述的美学自适应模块用于对文本-视觉融合模块得到的Prompt提示文本的图像特征进行前向传播、反向传播；所述的美学描述生成解码模块用于对美学自适应模块的输出进行特征解码，生成和图像相关的美学质量评价，以及关于该评价的文本解释；步骤3，将步骤1处理过的美学数据集中的每张图片、每张图片的文本描述、对应的美学得分标签作为训练集，对步骤2构建得到的图像美学可解释模型进行训练，得到训练好的图像美学可解释模型。步骤4，将待测的图像输入步骤3得到的训练好的图像美学可解释模型，得到输出结果。

全文数据：

权利要求：

百度查询：西北大学一种基于语言大模型的可解释性图像美学情感预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：脉冲注水压力波形精准调控鱼鳔稳压器、装置及方法_中国石油化工股份有限公司_202211549180.X

下一篇：一种战场通信定位系统、装置及测试方法_浙江省军工集团股份有限公司_202410127232.7

相关技术

脉冲注水压力波形精准调控鱼鳔稳压器、装置及方法_中国石油化工股份有限公司_202211549180.X

一种战场通信定位系统、装置及测试方法_浙江省军工集团股份有限公司_202410127232.7

灰度图像映射的恶意代码检测方法、系统、存储介质及计算机设备_三六零数字安全科技集团有限公司_202211559178.0

一种能源站调价方法、装置、计算机设备和可读存储介质_山东能链控股有限公司_202410149603.1

一种具有材质区分功能的触压传感检测系统、检测方法及制备方法_大连海事大学_202410274077.1

一种300MW级压缩空气储能电站压缩系统的电气主接线系统及其运行方法_中国能源建设集团江苏省电力设计院有限公司_202410317284.0

基于热重分析测量沥青路面自修复胶囊囊芯含量的方法_武汉理工大学_202410331310.5

一种高精密零件加工中的多工位夹具及一次成型方法_深圳市正泰隆科技有限公司_202410243263.9

高固含量氧化铝陶瓷造粒粉及其制备方法_重庆臻宝科技股份有限公司_202410217766.9

PICC导管助力装置_兰州大学_202210785700.0

一种高度可调的船舶高度检测系统_大连海事大学_202410262681.2

一种钴酸锂正极烧结用防吸锂匣钵及其制备方法_贵州鑫铠新材料科技有限公司_202410092522.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于语言大模型的可解释性图像美学情感预测方法_西北大学_202410057047.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务