买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种东巴字文档分割方法、装置、设备及存储介质_苏州市职业大学(苏州开放大学)_202310540883.4 

申请/专利权人:苏州市职业大学(苏州开放大学)

申请日:2023-05-15

公开(公告)日:2023-08-08

公开(公告)号:CN116563855A

主分类号:G06V30/148

分类号:G06V30/148;G06V30/18;G06V30/19;G06V30/41;G06V30/226

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.08.25#实质审查的生效;2023.08.08#公开

摘要:本申请公开了一种东巴字文档分割方法、装置、设备及存储介质,涉及文档识别技术领域,包括:利用预设投影算法对东巴字文档图像进行分割,得到分割后文档图像;在分割后文档图像中确定出若干个文字块和若干个空白间隔块,并确定为簇类样本;根据预设距离公式计算簇类样本之间的簇间距,并基于预设层次聚类条件对簇类样本进行合并,得到若干个合并后簇类;根据预设比例以及合并后簇类中簇类样本的数量将合并后簇类划分为目标簇和非目标簇;基于目标簇对应的特征值对分割后文档图像进行处理,以得到最终分割结果。这样一来,本申请可通过包含东巴文档格式特征的簇聚类结果对东巴文档图像处理,可以实现东巴文档的自适应分割,提升了分割效果。

主权项:1.一种东巴字文档分割方法,其特征在于,包括:利用预设投影算法对东巴字文档图像进行分割,得到分割后文档图像;在所述分割后文档图像中确定出若干个文字块和若干个空白间隔块,并将所述文字块以及所述空白间隔块确定为簇类样本;根据预设距离公式计算所述簇类样本之间的簇间距,并基于预设层次聚类条件根据所述簇间距对所述簇类样本进行合并,得到若干个合并后簇类;根据预设比例以及所述合并后簇类中簇类样本的数量将所述合并后簇类划分为目标簇和非目标簇;基于所述目标簇对应的特征值对所述分割后文档图像进行处理,以得到与所述东巴字文档图像对应的最终分割结果。

全文数据:

权利要求:

百度查询: 苏州市职业大学(苏州开放大学) 一种东巴字文档分割方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。