买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种中文词条多条件复合的排序方法_雅昌文化(集团)有限公司;北京雅昌艺术印刷有限公司;上海雅昌艺术印刷有限公司_202311614030.7 

申请/专利权人:雅昌文化(集团)有限公司;北京雅昌艺术印刷有限公司;上海雅昌艺术印刷有限公司

申请日:2023-11-29

公开(公告)日:2024-03-01

公开(公告)号:CN117633143A

主分类号:G06F16/31

分类号:G06F16/31;G06F16/338;G06F16/33

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本发明公开一种中文词条多条件复合的排序方法,包括:获取预先创建的汉字的拼音库;获取预先创建的汉字的笔画笔型索引库;初始化待排序中文词条清单;根据最长匹配的原则在所述拼音库里检索中文词条的拼音,写入拼音清单;从笔画笔型索引库里检索中文词条中每个汉字的索引值,写入索引值清单;对于任意两个待排序的中文词条,依次对各自清单中的元素根据先拼音后索引值的原则进行比较,从而得到这两个中文词条的排序顺序;对所有的待排序中文词条采用预设的排序算法,输出为目标排序结果。本发明解决了多音字、生僻字排序不准确的问题,实现了更精准的中文索引词条的排序。

主权项:1.一种中文词条多条件复合的排序方法,其特征在于,包括:步骤S10:获取预先创建的汉字的拼音库,包括汉字及其对应的拼音两个字段;其中,对于多音字的汉字以第一预设符号间隔多个拼音,对于词组与短语则以第二预设符号间隔每个汉字的拼音;步骤S20:获取预先创建的汉字的笔画笔型索引库,包含汉字、笔画笔形值、索引值三个字段;其中,汉字字段保存一个汉字,笔画笔形值字段为对应汉字在预设规范中的基本笔形序号的顺序并转换成数值保存,索引值字段代表对应汉字的笔画数、基本笔型序号数值的大小在笔画笔型索引库的位次;步骤S30:初始化待排序中文词条清单;其中,清单中每个词条为清单中的一个元素,每个元素包括拼音、索引值与页码三个属性;步骤S40:根据最长匹配的原则在所述拼音库里检索中文词条的拼音,写入拼音清单,所述拼音清单中元素与中文词条的汉字一一对应,清单长度与中文词条的汉字数量相等;步骤S50:从所述笔画笔型索引库里检索中文词条中每个汉字的索引值,写入索引值清单,所述索引值清单中元素与中文词条的汉字一一对应,清单长度与中文词条的汉字数量相等;步骤S60:对于任意两个待排序的中文词条,依次对各自清单中的元素根据先拼音后索引值的原则进行比较,从而得到这两个中文词条的排序顺序;步骤S70:对所有的待排序中文词条采用预设的排序算法,输出为目标排序结果。

全文数据:

权利要求:

百度查询: 雅昌文化(集团)有限公司;北京雅昌艺术印刷有限公司;上海雅昌艺术印刷有限公司 一种中文词条多条件复合的排序方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。