买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于字组的自动化外语地名汉字译写方法_民政部地名研究所_202110734948.X 

申请/专利权人:民政部地名研究所

申请日:2021-06-30

公开(公告)日:2024-03-12

公开(公告)号:CN113361288B

主分类号:G06F40/58

分类号:G06F40/58;G06F40/258;G06F40/253;G06F16/901

优先权:

专利状态码:有效-授权

法律状态:2024.03.12#授权;2021.09.24#实质审查的生效;2021.09.07#公开

摘要:本发明公开一种基于字组的自动化外语地名汉字译写方法。所述的方法包括:获取整条待翻译地名信息;根据字组查询表和约束规则表对获取的整条待翻译地名信息进行字组切分;并通过字组查询表获取切分后的每个字组的类型代码和字组代码;利用获得的每个字组的字组代码和类型代码查汉字对照表,得出该字组对应的汉字。本发明利用划分字组的方式进行计算机自动翻译,可以在较短的时间内翻译大量地名数据。

主权项:1.一种基于字组的自动化外语地名汉字译写方法,其特征在于,所述的方法至少包括下述步骤:1获取整条待翻译地名信息;2根据字组查询表和约束规则表对获取的整条待翻译地名信息进行字组切分;3并通过字组查询表获取切分后的每个字组的类型代码和字组代码;4按序将获得的每个字组的字组代码和类型代码查汉字对照表,得出该字组对应的汉字;所述的字组查询表中至少包括:字符拼写列、字组代码列、类型优先级列、长度优先级列以及不确定型字组标记列;其中,字符拼写列中每一行设置有一个词条,每个词条所在行所对应所述的字组代码列、类型优先级列、长度优先级列设置有预定的值;所述字组切分是采用最大正向匹配的方式进行切分的;其具体步骤为:31获取地名的字符串,字符串中字符的数量为N;32计算字组查询表每行长度优先级与类型优先级的和,作为查询优先级:33按查询优先级从高到低依次获取该行所对应的长度优先级的值M;34按长度优先级的值获取的字符串中M个字符为字符组,其中MN;35将获取的字符组在字组查询表中的字符拼写列进行匹配;如果找到,则匹配成功,提取该词条;如果未找到,则判断字符组中的字符数量是否为1,如果为1,则该字符做为匹配结果;如果不为1,则删除字符组中最后一个字符后作为新的字符组,返回步骤34;36判断字符串的字符数量是否为0,如果为0则匹配结束;如果不为零,则将匹配成功的字符组或字符去除后的字符串作为新的字符串,返回步骤33;所述的字组包括:元字组、辅字组、不确定型字组、特殊符号字组、词汇字组、语法词汇字组;所述的字组为能够区分译名的最小语音或字符单位。

全文数据:

权利要求:

百度查询: 民政部地名研究所 基于字组的自动化外语地名汉字译写方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。