申请/专利权人:电子科技大学
申请日:2021-12-31
公开(公告)日:2023-10-20
公开(公告)号:CN114359683B
主分类号:G06V10/94
分类号:G06V10/94;G06V10/96;G06V30/18
优先权:
专利状态码:有效-授权
法律状态:2023.10.20#授权;2022.05.03#实质审查的生效;2022.04.15#公开
摘要:本发明公开了一种面向文本定位的单内核HOG高效异构加速方法,其包括为每个像素分配一个工作项,并对每个像素周围的像素进行卷积,对卷积后的像素进行幅度和相位计算,通过双线性插值算法计算得到像素的离散梯度方向,并保存在硬件的局部内存中,释放为像素分配的工作项;为每个cell单元分配一个工作项,并进行硬件的全局索引;计算离散梯度方向的投票结果,完成每行像素的统计;对统计的像素进行归一化以及求和,组合成一个HOG特征向量,得到图像的特征向量;在异构平台对该方法加以实现,完成异构加速。本发明满足了文本定位实时性以及低能耗的需求,能够进一步提高场景字符识别技术的可靠性。
主权项:1.一种面向文本定位的单内核HOG高效异构加速方法,其特征在于,包括以下步骤:S1、获取灰度图像的像素,并为每个像素分配一个工作项;其中Cx×Cy个大小统一的连通像素区域组成一个cell单元;S2、在各个工作项中,利用差分模板及其转置对每个像素周围的像素进行行卷积与列卷积;S3、对卷积后的像素进行幅度和相位计算;S4、利用得到的幅度和相位,通过双线性插值算法计算得到像素的离散梯度方向,并保存在硬件的局部内存中,并进行硬件的局部内存同步,释放为像素分配的工作项;S5、为每个cell单元分配一个工作项,并进行硬件的全局索引;S6、创建用于统计像素离散梯度方向的统计变量,将每个像素所处的离散梯度方向直接并行加到统计变量中,并用一组变量对应计算一个cell单元中每行像素的离散梯度方向的投票结果,完成每行像素的统计,得到每个cell单元中不同离散梯度方向的个数;S7、进行硬件的局部内存同步,基于投票结果,利用每个工作项统计cell中一行的像素,并进行并行规约得到所有cell单元的梯度统计,将梯度统计的离散梯度结果保存在硬件的局部内存中,释放为cell单元分配的工作项;S8、利用一个工作项计算一个cell单元梯度统计后的离散梯度的归一化,将每个cell单元归一化后的结果求和,得到与每个cell单元对应的和值,将属于同一个block中的每个cell单元对应的和值缓存至硬件的局部内存中,并进行硬件的局部同步,得到每个block的局部方向梯度;其中一个图像包含若干个block;S9、将每个block的局部方向梯度组合成一个HOG特征向量,得到图像的特征向量;S10、将上述步骤加载到异构平台上,实现异构加速。
全文数据:
权利要求:
百度查询: 电子科技大学 一种面向文本定位的单内核HOG高效异构加速方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。