买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种藏文古籍的版面分析方法及系统_西藏大学;同方知网数字出版技术股份有限公司_202011434430.6 

申请/专利权人:西藏大学;同方知网数字出版技术股份有限公司

申请日:2020-12-10

公开(公告)日:2024-03-08

公开(公告)号:CN112561928B

主分类号:G06T7/11

分类号:G06T7/11;G06T7/136;G06T5/30;G06T5/70;G06V30/40

优先权:

专利状态码:有效-授权

法律状态:2024.03.08#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要:本发明涉及一种藏文古籍的版面分析方法及系统,获取藏文古籍图像,对藏文古籍图像进行二值化处理,获取藏文古籍图像的二值图像,对二值图像进行分离处理,获取文本文档和非文本文档,对文本文档进行区域分割,提取文本区域,获取非本文文档中的图像元素。本发明提供的藏文古籍的版面分析方法能够针对版面结构较复杂的藏文古籍进行可靠分析,并不依赖于具体文档的版面结构,提升处理效果,能够准确分析识别出其中的文本文档和非文本文档,并对文本文档和非文本文档进行可靠处理,而且,本发明提供的藏文古籍的版面分析方法中,降低了计算复杂度,减少了整个过程的计算时间,提高了分析精度和效率。

主权项:1.一种藏文古籍的版面分析方法,其特征在于,包括:获取藏文古籍图像;对所述藏文古籍图像进行二值化处理,获取所述藏文古籍图像的二值图像;对所述二值图像进行分离处理,获取所述二值图像中的文本文档和非文本文档;对所述文本文档进行区域分割,提取文本区域;获取所述非文本文档中的图像元素;所述对所述藏文古籍图像进行二值化处理,获取所述藏文古籍图像的二值图像,包括:对所述藏文古籍图像进行灰度化处理,得到灰度图像;对所述灰度图像进行二值化处理,得到所述藏文古籍图像的二值图像;所述对所述灰度图像进行二值化处理,得到所述藏文古籍图像的二值图像,包括:对所述灰度图像使用Sauvola算法求取每个像素x,y的局部阈值,计算公式如下: 其中,Tx,y为所述局部阈值,mx,y和sx,y表示像素中心为x,y的W×W窗口的局部平均值和标准差,R是标准差的最大值,参数k为预设参数;像素x,y的积分图像I的计算公式为: 其中,gx,y为所述灰度图像;任意W窗口的局部平均值mx,y和标准差sx,y的计算公式为: 其中,对于a×b的图像,窗口尺寸选为W=12×mina,b;将属于前景的像素赋值为1,背景像素赋值为0,所述藏文古籍图像的二值图像fx,y的计算公式为: 。

全文数据:

权利要求:

百度查询: 西藏大学;同方知网数字出版技术股份有限公司 一种藏文古籍的版面分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。