申请/专利权人:湖南蚁坊软件股份有限公司
申请日:2023-12-21
公开(公告)日:2024-03-01
公开(公告)号:CN117634474A
主分类号:G06F40/263
分类号:G06F40/263;G06F40/166;G06F40/242;G06F40/284;G06F40/30;G06F18/22;G06F18/24
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.03.19#实质审查的生效;2024.03.01#公开
摘要:本申请实施例属于自然语言处理领域,涉及一种应用于中日文本的语种识别方法及相关设备,该方法包括:获取用户终端发送的待识别文本;对待识别文本进行预处理操作,得到预处理文本;判断预处理文本是否属于中日文本字符;若预处理文本属于中日文本字符,则根据中日词配库以及语义分析模型对预处理文本进行语种判别处理,得到语种判别结果;若预处理文本不属于中日文本字符或者语种判别结果为无识别结果,则对预处理文本进行字符层次分类处理,得到目标识别结果;若语种判别结果为有识别结果,则将语种判别结果作为目标识别结果。本申请从语义角度出发,结合中日词配库与句法依存算法,对混合文本进行语种区分,有效提升混合文本的识别准确率。
主权项:1.一种应用于中日文本的语种识别方法,其特征在于,包括下述步骤:获取用户终端发送的待识别文本;对所述待识别文本进行预处理操作,得到预处理文本;判断所述预处理文本是否属于中日文本字符;若所述预处理文本属于中日文本字符,则根据中日词配库以及语义分析模型对所述预处理文本进行语种判别处理,得到语种判别结果;若所述预处理文本不属于中日文本字符或者所述语种判别结果为无识别结果,则对所述预处理文本进行字符层次分类处理,得到目标识别结果;若所述语种判别结果为有识别结果,则将所述语种判别结果作为所述目标识别结果。
全文数据:
权利要求:
百度查询: 湖南蚁坊软件股份有限公司 一种应用于中日文本的语种识别方法及相关设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。