申请/专利权人:南京三百云信息科技有限公司
申请日:2021-04-25
公开(公告)日:2024-03-08
公开(公告)号:CN113269197B
主分类号:G06V30/162
分类号:G06V30/162;G06V30/18;G06V30/19;G06T7/73;G06T7/11;G06V10/82;G06V10/766;G06N3/0464;G06N3/048;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2024.03.08#授权;2021.09.03#实质审查的生效;2021.08.17#公开
摘要:本发明公开了一种基于语义分割的证件图像顶点坐标回归系统,包括坐标回归模块,所述坐标回归模块设置在语义分割模块之后,主要是使用坐标回归模块将多种语义分割网络作为骨干网络,直接获得证件区域的多边形顶点坐标,坐标回归模块最终使用热力图中的最大值索引求得每个顶点的坐标。
主权项:1.一种基于语义分割的证件图像顶点坐标回归系统,其特征在于:包括坐标回归模块,所述坐标回归模块设置在语义分割模块之后;坐标回归模块包括特征图卷积模块、掩膜注意力模块、注意力融合模块和热力图计算模块;特征图卷积模块通讯连通语义分割模块中用于计算最终分割结果的网络层,特征图卷积模块包含若干3x3卷积、ReLu激活以及BatchNormalization层,得到与输入特征图相同宽高、通道数为回归顶点坐标数的输出结果至注意力融合模块;掩膜注意力模块通讯连通语义分割模块中语义分割结果输出端,经过若干3x3卷积、ReLu激活以及BatchNormalization层之后进行全局池化,得到宽高均为1、通道数为回归顶点坐标数的中间特征层,经过两个全连接层后得到该模块的输出结果至注意力融合模块;注意力融合模块将特征图卷积模块和掩膜注意力模块的输出特征图进行逐像素相加,再经过一个sigmoid激活层得到输出结果并输出至热力图计算模块;热力图计算模块的输入端通讯连接注意力融合模块的输出端,其宽高与语义分割网络特征图相同、通道数为回归顶点坐标数,特征图的每个通道表示每个顶点的热力图;在训练时直接将输入与标签进行损失计算,在推理时通过argmax函数计算每个通道的最大值索引,即预测的每个顶点坐标。
全文数据:
权利要求:
百度查询: 南京三百云信息科技有限公司 基于语义分割的证件图像顶点坐标回归系统和识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。