申请/专利权人:深圳市上融科技有限公司
申请日:2023-11-13
公开(公告)日:2024-02-27
公开(公告)号:CN117236297B
主分类号:G06F40/169
分类号:G06F40/169;G06F40/205;G06F40/30;G06N3/042;G06N3/0464;G06N3/0442;G06N3/045;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2024.02.27#授权;2024.01.02#实质审查的生效;2023.12.15#公开
摘要:本发明涉及领域,尤其涉及一种基于PDF跨页签字的实现方法。首先,构建融合模型,通过图卷积网络提取图像特征、长短时记忆网络提取文本特征、自注意力机制赋予不同特征不同的权重、强化学习优化模型参数,并找到最优的模型参数;其次,引入自适应性元学习策略,优化模型结构;然后,通过非欧几里得空间变换方法对图像进行空间变换,提取图像特征,计算签字区域的坐标,并对坐标进行优化;最后,提出基于多维空间映射的动态渲染算法。解决了现有技术没有深度分析PDF文档的语义和结构;缺乏足够的适应性和泛化能力;在复杂的文档结构中无法精确找到签字区域;签字图像与PDF文档没有自然融合,渲染效果不理想,影响签字图像的清晰度和可读性的问题。
主权项:1.一种基于PDF跨页签字的实现方法,其特征在于,包括以下步骤:S100:构建融合模型,首先处理图像数据,通过图卷积网络提取图像特征,公式如下: 其中,表示图卷积网络的输出,是图卷积网络的参数,是图像数据,是用来规范化图卷积网络的输出,是邻接矩阵的元素,表示图像中第i个和第j个像素点之间的连接关系,是图像数据的第j个像素点,和是权重和偏置,是激活函数;然后处理文本数据,通过长短时记忆网络提取文本特征;接着采用自注意力机制加权融合图像和文本特征,通过计算特征之间的相似性,自注意力机制赋予不同特征不同的权重;并通过强化学习优化模型参数,并找到最优的模型参数,融合模型的公式如下: 其中,表示融合模型的输出,表示模型的融合操作,表示长短时记忆网络的输出,表示自注意力机制的输出,是输入的文本数据,是长短时记忆网络的参数,是自注意力机制的参数;引入多任务学习和贝叶斯优化,定义语义分析和位置识别的损失函数;S200:引入自适应性元学习策略,使融合模型适应不同类型的PDF文档,优化模型结构;具体的,定义内部表示调整函数,所述内部表示调整函数通过梯度上升来优化模型的内部表示,具体的调整公式如下: 其中,是调整后的模型内部表示,是融合模型的初始内部表示,是验证集上的损失,是超参数,是梯度,是激活函数;在对融合模型的内部表示进行调整后,定义任务适应性调整函数,所述任务适应性调整函数通过梯度上升来优化模型的任务适应性,具体的调整公式如下: 其中,是调整后的模型,是超参数,是总损失,是语义分析和位置识别损失的加权和;通过正则化和参数更新来防止模型过拟合,并优化模型的泛化能力,具体的更新公式如下: 其中,表示更新后的模型,是正则化参数,是超参数,是模型的正则化项,是逆操作,用于计算模型参数的逆;S300:通过非欧几里得空间变换方法对图像进行空间变换,提取图像特征,计算签字区域的坐标,并对坐标进行优化;S400:提出基于多维空间映射的动态渲染算法;具体的,将签字图像和PDF文档映射到多维空间中,分别表示为和,在多维空间中,计算签字图像与PDF文档的融合参数,的数学模型表示为: 其中,和分别为和中的点;将多维空间中融合后的结果映射回二维空间,得到最终的渲染图像,数学模型表示为: 其中,代表签字图像与目标区域融合后的结果,表示多维映射;并优化渲染效果,数学模型表示为: 其中,为优化参数,决定了锐化和平滑操作的权重,代表优化渲染效果后的图像,表示像素点坐标,表示对签字图像进行锐化操作,表示对签字图像进行平滑操作。
全文数据:
权利要求:
百度查询: 深圳市上融科技有限公司 一种基于PDF跨页签字的实现方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。