申请/专利权人:苏州元澄科技股份有限公司
申请日:2024-03-06
公开(公告)日:2024-04-05
公开(公告)号:CN117827851A
主分类号:G06F16/22
分类号:G06F16/22;G06F16/27;H04L43/0876
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.23#实质审查的生效;2024.04.05#公开
摘要:本发明公开了一种用于流基数测量的数据处理结构及其应用,该数据处理结构包括:基数估计器,包括一个长度为M的位图;大流部分,用于记录基数大于设定阈值的流信息;小流部分,包括一个CMSketch。本发明将多流的流式基数估计技术与通常运用在流频数测量中的大小流区分存储技术结合,做到了对大基数流的精确估计,对小基数流较为精确的估计,同时可以完成多种基数测量任务。并且为大流部分与小流部分设计了一个巧妙的交换过程,保证了大流部分的准确度,同时确保小流部分不会存储大基数流的基数信息,避免了小基数流与大基数流共享一个计数器时导致小基数的过高估计。
主权项:1.一种用于流基数测量的数据处理结构,其特征在于,包括:基数估计器,包括一个长度为M的位图;大流部分,用于记录基数大于设定阈值的流信息;小流部分,包括一个CMSketch,所述CMSketch的基本结构是一个d行w列的二维寄存器数组C,每一个寄存器作为一个计数器,C[i][j]表示第i行第j列的计数器;所述CMSketch的每一行关联一个哈希函数hi,1≤i≤d,hi会将流f映射到第i行第hif列的计数器;当向CMSketch中插入一条大小为x的流f时,CMSketch会将流f映射到每一行的计数器C[i][hif]增加x;当查询流f的大小时,CMSketch会报告流f映射到的d个计数器中值最小的那个计数器的值。
全文数据:
权利要求:
百度查询: 苏州元澄科技股份有限公司 一种用于流基数测量的数据处理结构及其应用
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。