买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】处理手写中列表的方法和计算装置_迈思慧公司_202180011062.0 

申请/专利权人:迈思慧公司

申请日:2021-02-02

公开(公告)日:2024-04-02

公开(公告)号:CN115004262B

主分类号:G06V30/414

分类号:G06V30/414;G06V30/32;G06V10/764

优先权:["20200207 EP 20305120.6"]

专利状态码:有效-授权

法律状态:2024.04.02#授权;2023.03.21#实质审查的生效;2022.09.02#公开

摘要:本发明涉及一种用于处理手写IN中的列表的方法,所述方法包括:初始地将多个文本行LN中的每个文本行分类为不是列表的一部分的不同文本项TI;以及分类过程,所述分类过程包括在每个文本行LN中进行模式检测,以用于将以预定列表符号BT开始的每个文本行分类为作为列表的一部分的不同的列表项LI;确定每个文本项TI相对于参考位置30的项缩进22;以及针对每个列表项LI确定表示所述列表项中所包括的文本的缩进的文本缩进24;以及合并步骤,所述合并步骤用于如果满足预定义条件,则合并为同一文本项TI的一部分或者合并为同一列表项LI的一部分。然后,可以基于所述合并过程的结果生成文本结构数据模型,从而将每个文本行LN定义为文本项TI或列表项LI的一部分。

主权项:1.一种由计算装置100实现的用于处理手写中的列表的方法,其包括:通过对电子文档中的多个数字墨水笔划执行文本手写辨识来辨识文本,所述文本包括多个连续的文本行;初始将每个所辨识的文本行分类为不是列表的一部分的不同文本项;分类过程,所述分类过程包括以下步骤:a在每个文本行中进行模式检测,以确定所述文本行是否以指示所述文本行是列表的一部分的预定列表符号开始,并且将以预定列表符号开始的每个文本行分类为作为列表的一部分的不同列表项;b响应于步骤a,确定每个文本项相对于参考位置的项缩进,并且为每个列表项确定表示所述列表项中所包括的文本相对于所述参考位置的缩进的文本缩进;c响应于步骤b,进行合并过程,所述合并过程包括:如果由第一文本行后面接着第二文本行形成的每对连续文本行的所述第一文本行和所述第二文本行是具有相同项缩进的文本项,并且如果在所述第一文本行的结尾没有足够的可用空间来容纳开始所述第二文本行的第一个字词,则将所述文本中的所述多个连续的文本行的每一对合并为同一文本项的一部分;以及如果第一文本行是列表项,并且第二文本行是具有与所述第一文本行的文本缩进相匹配的项缩进的文本项,并且如果在所述第一文本行的结尾没有足够的可用空间来容纳开始所述第二文本行的第一个字词,则将由所述第一文本行后面接着所述第二文本行形成的每对连续文本行合并为同一列表项的一部分;基于所述合并过程的结果,生成文本结构数据模型,所述文本结构数据模型将每个文本行定义为文本项或列表项的一部分。

全文数据:

权利要求:

百度查询: 迈思慧公司 处理手写中列表的方法和计算装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。