买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】混合高斯分布和二项分布的两阶段甲骨文字分割方法_辽宁师范大学_202210127612.1 

申请/专利权人:辽宁师范大学

申请日:2022-02-11

公开(公告)日:2024-04-02

公开(公告)号:CN114565756B

主分类号:G06V10/26

分类号:G06V10/26;G06V30/148;G06V10/28;G06V10/50;G06V10/762;G06T7/11;G06T7/12;G06T7/194

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.06.17#实质审查的生效;2022.05.31#公开

摘要:本发明公开一种混合高斯分布和二项分布的两阶段甲骨文字分割方法。首先,利用颜色空间转换提取甲骨拓片图像的亮度分量;其次,以混合高斯分布模型建模图像的全局统计特性,联合K‑均值算法和EM算法进行优化求解,进而以相对熵测度为约束,得到抑制了点状噪声的粗分割结果;然后,利用顶帽运算和连通区域分析,去除片状斑纹、盾纹、齿缝以及大面积背景;最后,以二项分布对连通区域的面积进行建模,利用最大类间方差计算该二项分布的方差,进而结合外接矩形分析,实现对残留的兆纹、刻痕和固有纹理的自适应填充,获得甲骨文字的最终分割结果。

主权项:1.一种混合高斯分布和二项分布的两阶段甲骨文字分割方法,其特征在于按照如下步骤进行:步骤1.输入待分割的甲骨卜辞拓片图像I,令其高度为hI像素,宽度为wI像素;步骤2.将I的颜色空间从RGB转换到HSV,并提取其亮度分量IV;步骤3.统计IV中所有像素值的归一化直方图hV;步骤4.利用混合高斯分布模型和相对熵测度对IV进行粗分割;步骤4.1根据公式1和公式2,建立混合高斯分布模型fxi|Π,Θ; 所述xi表示IV的第i个像素且i∈{1,2,3,…,hI×wI},C表示混合高斯分布模型中的成分分布数量,j∈{1,2,…,C},πij表示像素xi属于混合高斯分布模型中第j个高斯分布的先验概率,0≤πij≤1且Pjxi|Θj表示混合高斯分布模型中第j个高斯分布的概率密度函数,表示第j个高斯分布的概率密度函数的参数集,μj和分别表示第j个高斯分布的数学期望和方差,Π={πij},Θ={Θ1,Θ2,…,ΘC};步骤4.2将IV的全部hI×wI个像素值作为观测值,采用K-均值算法进行聚类,令C等于聚类过程所得到的聚类数量,并令Cj表示第j个聚类中心且j∈{1,2,…,C};步骤4.3利用C个聚类中心对μj进行初始化,令μj=Cj;步骤4.4根据公式3,对进行初始化; 步骤4.5根据公式4,计算像素xi属于第j个聚类的权重θxi,j; 所述Ni表示以像素xi为中心、大小为5×5的邻域,xm表示邻域Ni中的任意像素;步骤4.6根据公式5,计算像素xi属于各个聚类的权重之和Γi; 步骤4.7根据公式6,对πij进行初始化; 步骤4.8利用期望最大化算法求解混合高斯分布模型fxi|Π,Θ,得到其最优参数集Π和Θ;步骤4.9令t←1,D*←+∞,TZ←1,所述t是一个循环计数器,PB表示反映背景区域像素值分布的高斯概率密度函数集合,PO表示反映甲骨文字区域像素值分布的高斯概率密度函数集合,D*表示最佳的相对熵测度,TZ表示最佳的粗分割阈值;步骤4.10根据公式7和公式8,建立背景区域的累积直方图pBt和甲骨文字区域的累积直方图pOt; 所述hVv表示在直方图hV中亮度值等于v的像素出现的归一化频率;步骤4.11对于任意的j∈{1,2,…,C},若fxi|Π,Θ中第j个高斯分布的概率密度函数Pjxi|Θj的数学期望μj小于t,则令PB←PB∪Pjxi|Θj,否则,令PO←PO∪Pjxi|Θj,从而利用t将fxi|Π,Θ中的C个成分分布划分为两个集合,并设PB集合包含NB个高斯概率密度函数,PO集合包含NO个高斯概率密度函数;步骤4.12根据公式9,建立反映背景区域像素值分布的混合高斯概率密度函数 所述x表示像素值且x∈{0,1,2,…,255},表示PB集合的第n个高斯概率密度函数,表示在fxi|Π,Θ中对应的最优的先验概率,表示在fxi|Π,Θ中对应的最优的参数集且μBn表示的数学期望,表示的方差;步骤4.13根据公式10,建立反映甲骨文字区域像素值分布的混合高斯概率密度函数 所述表示PO集合的第n个高斯概率密度函数,表示在fxi|Π,Θ中对应的最优的先验概率,表示在fxi|Π,Θ中对应的最优的参数集且μOn表示的数学期望,表示的方差;步骤4.14根据公式11,计算由多个高斯概率密度函数拟合的归一化先验概率分布pVv; 所述v表示像素值且v∈{0,1,2,…,255},表示当x=v时混合高斯概率密度函数的值,表示当x=v时混合高斯概率密度函数的值;步骤4.15根据公式12,计算pVv与hVv之间的相对熵测度DhV|pV; 步骤4.16若DhV|pV<D*,则令TZ←t,D*←DhV|pV,否则,保持D*和TZ不变;步骤4.17令t←t+1,若t≥255,则转入步骤4.18,否则,令返回步骤4.10;步骤4.18将IV中像素值不小于TZ的像素判定为甲骨文字区域,将像素值小于TZ的像素判定为背景区域,从而获得粗分割结果I′V,所述I′V是一幅二值图像;步骤5.采用半径为r个像素的圆盘型结构元素,对I′V进行形态学顶帽运算,从而去除I′V中与甲骨文字相互粘连的、较大面积的片状斑纹、盾纹和齿缝,得到二值图像I″V,所述r是一个预设常量;步骤6.对I″V中的每个8-连通区域进行标记,并将连通面积小于Aconn的8-连通区域填充为背景,从而去除I″V中残留的离散分布的小面积片状斑纹,得到二值图像I″′V,所述Aconn是一个预设常量;步骤7.利用基于最大类间方差和二项分布的填充方法对二值图像I″′V进行处理,得到填充后的二值图像步骤7.1对I″′V中的每个8-连通区域进行标记,令8-连通区域的总数为Ncon;步骤7.2计算I″′V中每个8-连通区域的面积和外接矩形,并令Aα表示第α个8-连通区域的面积,令Amax表示I″′V中所有8-连通区域的最大面积,所述1≤α≤Ncon;步骤7.3统计I″′V中所有8-连通区域的面积直方图,并令表示面积为p的8-连通区域出现的频率,所述p为正整数且1≤p≤Amax;步骤7.4根据公式13-公式17,计算出一个自适应的面积阈值AT; mean+p=Average{Aα|Aα≥p,1≤α≤Ncon}14mean-p=Average{Aα|Aαp,1≤α≤Ncon}15 所述count+p表示面积不小于p的8-连通区域出现的频率之和,count-p表示面积小于p的8-连通区域出现的频率之和,mean+p表示面积不小于p的8-连通区域的平均面积,mean-p表示面积小于p的8-连通区域的平均面积,Average{·}表示求平均值的函数,表示面积为a的8-连通区域出现的频率;步骤7.5遍历I″′V中的每个8-连通区域,根据公式18计算出面积小于AT的所有8-连通区域的平均面积Aavg;Aavg=Average{Aα|AαAT,1≤α≤Ncon}18步骤7.6遍历I″′V中的每个8-连通区域,并根据其连通面积进行区域判别,从而对非文字区域进行填充,得到步骤7.6.1若当前遍历的8-连通区域的面积大于或等于AT,则将该8-连通区域判定为甲骨卜辞文字并保持不变;步骤7.6.2若当前遍历的8-连通区域的面积小于AT并且大于Aavg,则将该8-连通区域判定为甲骨卜辞文字并保持不变;步骤7.6.3若当前遍历的8-连通区域的面积小于AT并且小于Aavg,则进一步计算其外接矩形的高宽比Rw_h,若Rw_h≤RT,则将该8-连通区域判定为甲骨卜辞文字的孤立笔划并保持不变,否则将其判定为残留的兆纹和刻痕,将其填充为背景,所述RT是一个预设常量;步骤8.输出二值图像

全文数据:

权利要求:

百度查询: 辽宁师范大学 混合高斯分布和二项分布的两阶段甲骨文字分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。