买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种多中文词组的谐音拆分处理方法及装置_武汉杏仁桉科技有限公司_202410070087.3 

申请/专利权人:武汉杏仁桉科技有限公司

申请日:2024-01-18

公开(公告)日:2024-02-23

公开(公告)号:CN117592473A

主分类号:G06F40/289

分类号:G06F40/289;G06F18/22

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明公开了一种多中文词组的谐音拆分处理方法及装置,首先获取多个待处理中文词组;并从每个待处理中文词组中提取一个汉字组成初始汉字组合;然后根据初始汉字组合的长度对其进行循环拆分;接着将每次拆分得到的子串转换为拼音后分别与预先构建的数据库中的词语的拼音进行匹配,根据匹配情况得到匹配结果,将匹配结果和对应的子串作为一条记录加入至结果集;再输出结果集,作为多中文词组的处理结果。本发明提供的方法从每个待处理中文词组中提取出一个汉字组成初始汉字组合,并且在进行匹配时,考虑了汉字构成不同但拼音相同的情况,即考虑谐音,使得拆分结果更全面,记忆方式更为丰富,实际应用过程中可以提高多中文词组的学习效率。

主权项:1.一种多中文词组的谐音拆分处理方法,其特征在于,包括:获取多个待处理中文词组;从每个待处理中文词组中提取出一个汉字,组成初始汉字组合;根据初始汉字组合的长度对初始汉字组合进行循环拆分,其中,循环拆分的过程包括:每次根据初始汉字组合的长度按照从左到右的顺序由多到少依次截取对应长度的汉字组合作为第一子串,其余汉字或者汉字组合作为第二子串;判断第二子串的长度是否大于1,如果大于1,则将第二子串作为当前汉字组合进行循环拆分,其中,每次拆分得到的所有子串的长度之和等于初始汉字组合的长度;将每次拆分得到的子串转换为去声调的拼音,然后将子串对应的拼音分别与预先构建的数据库中的词语的拼音进行匹配,根据匹配情况得到匹配结果,将匹配结果和对应的子串作为一条记录加入至结果集;输出结果集,作为多中文词组的谐音拆分处理结果。

全文数据:

权利要求:

百度查询: 武汉杏仁桉科技有限公司 一种多中文词组的谐音拆分处理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。