买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文本中数值内容的纠错方法、装置及电子设备_北京百度网讯科技有限公司_202011561776.2 

申请/专利权人:北京百度网讯科技有限公司

申请日:2020-12-25

公开(公告)日:2024-04-02

公开(公告)号:CN112560430B

主分类号:G06F40/194

分类号:G06F40/194;G06F40/166

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要:本申请公开了一种文本中数值内容的纠错方法、装置及电子设备,涉及自然语言处理、深度学习等人工智能技术领域。实现方案为:获取待处理的目标文本;确定目标文本中包括的原始数值内容;确定每个原始数值内容对应的目标类型;根据每个目标类型对应的纠错方式,将对应的每个所述原始数值内容进行纠错。由此,根据数值内容的类型实现对数值内容的纠错,不仅仅局限于数值的格式纠错,还对数值内容进行逻辑纠错,提高了数值纠错能力,进而提高了错误数值检出和纠正的召回率。

主权项:1.一种文本中数值内容的纠错方法,包括:获取待处理的目标文本;确定所述目标文本中包括的原始数值内容;确定每个所述原始数值内容对应的目标类型;获取每个目标类型对应的纠错方式,其中,每个目标类型对应一种纠错方式;根据每个所述目标类型对应的纠错方式,将对应的每个所述原始数值内容进行纠错;所述确定所述目标文本中包括的原始数值内容,包括:基于指定的关键词,对所述目标文本进行遍历,以确定所述目标文本中包括的与所述指定的关键词匹配的原始数值内容;和或,基于指定的模版,对所述目标文本进行遍历,以确定所述目标文本中包括的与所述指定的模板匹配的原始数值内容;其中,所述目标文本中包括计数类数值,所述根据每个所述目标类型对应的纠错方式,将对应的每个所述原始数值内容进行纠错,包括:确定所述计数类数值对应的起始计数点及终止计数点;根据所述终止计数点及起始计数点,确定目标计数值;在所述目标计数值与所述计数类数值不匹配的情况下,利用所述目标计算值替换所述计数类数值。

全文数据:

权利要求:

百度查询: 北京百度网讯科技有限公司 文本中数值内容的纠错方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。