买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】档案分类方法及平台_河北省中医院_202410117785.4 

申请/专利权人:河北省中医院

申请日:2024-01-29

公开(公告)日:2024-04-16

公开(公告)号:CN117648473B

主分类号:G06F16/906

分类号:G06F16/906;G06F16/93;G06F18/24;G16H10/60

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本公开提供了一种档案分类方法及平台,属于数据分类技术领域,该方法包括:获取用户预先设定的多级分类类别,基于预设的映射关系确定多级分类类别对应的词组权重。词组权重为每个标准词组对应的权重。获取待分类的第一档案,提取第一档案中的词组,得到多个第一词组。将多个第一词组转换为多个对应的标准词组,得到多个目标标准词组。基于目标标准词组以及词组权重生成第一档案的特征向量。将第一档案的特征向量输入至预先训练的分类器中,得到第一档案对应的分类类别。本公开提供的档案分类方法能够自动对不同内容的档案进行分类,针对不同的级别顺序实现不同的分类结果,以达到更加全面智能的档案分类效果。

主权项:1.一种档案分类方法,其特征在于,包括:获取用户预先设定的多级分类类别,基于所述多级分类类别的级别顺序确定词组权重;所述词组权重为每个标准词组对应的权重;获取待分类的第一档案,提取所述第一档案中的词组,得到多个第一词组;将所述多个第一词组转换为多个对应的标准词组,得到多个目标标准词组;基于每个目标标准词组以及所述词组权重生成每个目标标准词组的特征向量;基于每个目标标准词组的特征向量对预设的特征向量模板进行填充,得到所述第一档案的特征向量;所述特征向量模板包含多个填充位置,每个填充位置对应一种词组属性;遍历所述特征向量模板中的每个填充位置,对每个填充位置执行填充操作;所述填充操作包括:响应于所述多个目标标准词组中存在一个目标标准词组与第一填充位置对应的词组属性相符,将对应于所述第一填充位置的目标标准词组的特征向量填充至所述第一填充位置;响应于所述多个目标标准词组中不存在任何目标标准词组与第一填充位置对应的词组属性相符,将预设特征向量填充至所述第一填充位置中;其中,所述第一填充位置为当前遍历到的填充位置;将所述第一档案的特征向量输入至预先训练的分类器中,得到所述第一档案对应的所述分类类别。

全文数据:

权利要求:

百度查询: 河北省中医院 档案分类方法及平台

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。