买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于特征向量的数据存储和索引的方法及装置_广州芳禾数据有限公司_202311694065.6 

申请/专利权人:广州芳禾数据有限公司

申请日:2023-12-11

公开(公告)日:2024-04-26

公开(公告)号:CN117931981A

主分类号:G06F16/31

分类号:G06F16/31;G06F16/33;G06F16/383;G06F18/22;G06F40/295

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本申请公开了一种基于特征向量的数据存储和索引的方法及装置,涉及数据处理技术领域。该方法包括数据存储和数据索引。该装置适用于该基于特征向量的数据存储和索引的方法。本申请的基于特征向量的数据存储和索引的方法及装置,能够实现待测试的文档或数据的重要性评估,并以毫秒级别完成评估的过程,从技术的层面出发,使用基于向量相似度匹配的方式,快速识别输入的数据或文档的重要等级,提高了任务完成效率。

主权项:1.一种基于特征向量的数据存储和索引的方法,其特征在于,该方法包括数据存储和数据索引;所述数据存储包括以下步骤:构建行业重要数据的特征比对库,所述特征比对库用于存储行业重要数据对应的特征集合,所述特征集合包括对应于显式特征的命名实体集合和对应于隐式特征的隐式特征集合;对于具有显式特征的文档或数据,通过命名实体识别算法处理的重要数据的字段规则,与输入由同样词空间处理的文档-向量进行对比,根据向量相似度,评估被输入的文档或数据的重要等级后,将该文档或数据和对应的重要等级存储于数据库中;对于具有隐式特征的文档或数据,通过索引算法处理的向量,并与输入同样类型的文件进行对比,评估被输入的数据的重要等级后,将该文档或数据和对应的重要等级存储于数据库中;所述数据索引包括以下步骤:将所需查询的目标输入后,获取该目标对应的字段规则,由命名实体识别算法反向处理获得该目标对应的向量数据,或通过所述索引算法将该目标转换成向量数据;将得到的向量数据在向量数据库中转化为高效的索引结构,使所述向量数据库中与该目标的向量数据相似的向量被定位和检索;计算被定位和检索到的向量与输入的目标对应的向量数据之间的距离,确认与该输入的目标对应的向量数据最接近的向量,并基于该向量返回所述数据库中的相关结果。

全文数据:

权利要求:

百度查询: 广州芳禾数据有限公司 一种基于特征向量的数据存储和索引的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。