申请/专利权人:北方健康医疗大数据科技有限公司
申请日:2024-02-01
公开(公告)日:2024-04-30
公开(公告)号:CN117688013B
主分类号:G06F16/22
分类号:G06F16/22;G06F16/215;G06F16/23;G06F16/2455;G06F16/28
优先权:
专利状态码:有效-授权
法律状态:2024.04.30#授权;2024.03.29#实质审查的生效;2024.03.12#公开
摘要:本发明涉及主索引生成技术领域,具体提供一种基于缓存索引的主索引生成方法、装置、设备及介质,所述方法包括:构建供不同来源数据灌入的多个源数据通道,并对构建的多个源数据通道进行划分;按照业务需求构建多级多规则缓存主索引;对通过源数据通道灌入的数据按照预设条件进行过滤,获取需要构建主索引的有效的源数据;根据获取的有效的源数据对多级多规则缓存主索引进行逐规则逐级索引查询,获取第一主索引;对获取的第一主索引进行去重处理,并基于去重结果逐级实时自动进行缓存索引更新和对应源数据的存储。对源数据进行过滤,提高了数据的精确性,通过逐级逐规则查询索引以及去重处理,有助于提高主索引效率。
主权项:1.一种基于缓存索引的主索引生成方法,其特征在于,包括以下步骤:构建供不同来源数据灌入的多个源数据通道,并对构建的多个源数据通道进行划分;按照业务需求构建多级多规则缓存主索引;对通过源数据通道灌入的数据按照预设条件进行过滤,获取需要构建主索引的有效的源数据;根据获取的有效的源数据对多级多规则缓存主索引进行逐规则逐级索引查询,获取第一主索引;对获取的第一主索引进行去重处理,并基于去重结果逐级实时自动进行缓存索引更新和对应源数据的存储;所述源数据通道至少包括需要构建全新主索引的数据的灌入通道,定义为全新主索引数据通道;对获取的第一主索引进行去重处理,并基于去重结果逐级实时自动进行缓存索引更新和对应源数据的存储的步骤包括:对获取的第一主索引进行去重处理;判断去重处理后第一主索引的条数是否为0;若是,将需要构建主索引的有效的源数据转发至全新主索引数据通道进行处理;若否,判断去重处理后第一主索引的条数是否等于1;若是,进行第一主索引填充,并将填充后的第一主索引的源数据追加到目标数据仓库;若否,将第一主索引进行合并,利用合并后的第一主索引对多级多规则缓存主索引进行更新,并将合并后的第一主索引及填充合并后第一主索引的源数据更新和或追加到目标数据仓库;将需要构建主索引的有效的源数据转发至全新主索引数据通道进行处理的步骤包括:将需要构建主索引的有效的源数据转发通过全新主索引数据通道灌入;对有效的通过全新主索引数据通道灌入的数据进行串行查询,获取第二主索引;对获取到的第二主索引进行去重处理;判断去重处理后第二主索引的条数是否为0;若是,创建全新主索引并将创建的全新主索引及对应的源数据追加到目标数据仓库;若否,判断去重处理后第二主索引的条数是否等于1;若否,将第二主索引进行合并,利用合并后的第二主索引对多级多规则缓存主索引进行更新,并将合并后的第二主索引及填充合并后第二主索引的源数据更新和或追加到目标数据仓库;若是,进行第二主索引填充,并将填充后的第二主索引的源数据追加到目标数据仓库。
全文数据:
权利要求:
百度查询: 北方健康医疗大数据科技有限公司 一种基于缓存索引的主索引生成方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。