申请/专利权人:北京印刷学院
申请日:2023-12-27
公开(公告)日:2024-03-22
公开(公告)号:CN117745887A
主分类号:G06T11/60
分类号:G06T11/60;G06V10/44;G06N3/045;G06N3/0464;G06N3/0475;G06N3/094
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本申请提供一种基于Transformer‑GAN包装版式布局智能设计方法,其利用深度学习、强化学习等智能算法对包装版式设计所需要的图片和文字等元素进行合理的排布,自动地生成符合美学规则、用户偏好等约束的布局。本申请利用设计序列模块提取布局特征,利用布局生成模块生成布局信息,然后,通过将设计序列模块的输出经过CNN和Transformer块后进入BiLSTM,并将内容感知模块的输出直接进入BiLSTM网络,构建出能够同时考虑图像内容和布局信息来进行布局生成的DPformer‑GAN模型。本申请所提供的模型能够实现图文版式的综合布局设计。其应用于各类设计工作中,能够有效提升设计者的工作效率,为需求者降低成本,也可与文生图模型结合以搭建更高水平的智能设计平台。
主权项:1.一种基于Transformer-GAN包装版式布局智能设计方法,其特征在于,步骤包括在生成器G·中按照以下步骤计算布局方案,然后根据所述布局方案输出相应的包装版式:将原始图像输入至边界感知分割网络Basnet中,计算获得原始图像所对应的显著图;将原始图像及其显著图输入至内容感知模块,然后使用特征金字塔结构的ResNet-50作为视觉特征提取的骨干网络提取原始图像所对应的视觉特征Vf;将随机初始化的布局输入至设计序列模块,先通过布局信息序列化算法对布局信息按照丰富和重要程度进行排序,生成一个设计序列,然后将所述设计序列输入Transformer编码器中得到布局特征;将内容感知模块所获得的视觉特征Vf以及设计序列模块所获得的布局特征共同输入至布局生成模块,生成布局方案;其中,所述生成器G·预先经由判别器D·按照如下的目标函数交替优化训练获得;所述目标函数设置为: 其中,G·表示生成器,D·表示判别器,l表示布局特征,h表示初始化的图像特征,z表示随机布局。
全文数据:
权利要求:
百度查询: 北京印刷学院 基于Transformer-GAN包装版式布局智能设计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。