买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于分词的单词序列获取方法、装置和计算机设备_深圳平安医疗健康科技服务有限公司_201911360640.2 

申请/专利权人:深圳平安医疗健康科技服务有限公司

申请日:2019-12-25

公开(公告)日:2022-11-25

公开(公告)号:CN111178070B

主分类号:G06F40/289

分类号:G06F40/289

优先权:

专利状态码:有效-授权

法律状态:2022.11.25#授权;2021.10.22#实质审查的生效;2020.05.19#公开

摘要:本申请揭示了一种基于分词的单词序列获取方法、装置、计算机设备和存储介质,所述方法包括:获取待分词的指定文本;执行第一次分词指令,所述第一次分词指令用于指示将所述指定文本分别输入至预设的n个分词工具,以得到n个第一分词结果;执行第一次筛选指令,所述第一次筛选指令用于从所述n个第一分词结果中筛选出指定第一分词结果;依次执行第二次分词指令和第二次筛选指令、第三次分词指令和第三次筛选指令、...、第m次分词指令和第m次筛选指令;若所述指定第m剩余文本不能再次分词,则将指定第一分词、...、指定第m分词和所述指定第m剩余文本顺序连接,从而得到指定单词序列。从而提高了分词的准确性。

主权项:1.一种基于分词的单词序列获取方法,其特征在于,包括:获取待分词的指定文本;执行第一次分词指令,所述第一次分词指令用于指示将所述指定文本分别输入至预设的n个分词工具,以得到所述n个分词工具对应输出的n个第一分词结果,其中所述第一分词结果由第一分词和除所述第一分词之外的第一剩余文本构成;执行第一次筛选指令,所述第一次筛选指令用于指示根据预设的分词结果筛选方法,从所述n个第一分词结果中筛选出指定第一分词结果,其中所述指定第一分词结果由指定第一分词和指定第一剩余文本构成;依次执行第二次分词指令和第二次筛选指令、第三次分词指令和第三次筛选指令、...、第m次分词指令和第m次筛选指令,其中所述第m次分词指令用于指示将指定第m-1剩余文本分别输入至所述n个分词工具,以得到所述n个分词工具对应输出的n个第m分词结果,所述第m分词结果由第m分词和除所述第m分词之外的第m剩余文本构成,m为大于1的整数;所述第m次筛选指令用于指示根据预设的分词结果筛选方法,从所述n个第m分词结果中筛选出指定第m分词结果,其中所述指定第m分词结果由指定第m分词和指定第m剩余文本构成;根据预设的分词判断方法,判断所述指定第m剩余文本是否能够再次分词;若所述指定第m剩余文本不能再次分词,则将指定第一分词、...、指定第m分词和所述指定第m剩余文本顺序连接,从而得到指定单词序列;所述根据预设的分词结果筛选方法,从所述n个第一分词结果中筛选出指定第一分词结果的步骤,包括:对所述n个第一分词结果进行聚类处理,从而得到多个类别,其中同一个类别中的第一分词结果相同;从所述多个类别中选出指定类别,其中所述指定类别中的第一分词结果的数量多于其他类别中的第一分词结果的数量;将所述指定类别中的第一分词结果记为指定第一分词结果。

全文数据:

权利要求:

百度查询: 深圳平安医疗健康科技服务有限公司 基于分词的单词序列获取方法、装置和计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。