买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】数据记录筛选方法和装置_珠海格力电器股份有限公司_201811034897.4 

申请/专利权人:珠海格力电器股份有限公司

申请日:2018-09-05

公开(公告)日:2021-02-19

公开(公告)号:CN109471873B

主分类号:G06F16/2453(20190101)

分类号:G06F16/2453(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.19#授权;2019.04.09#实质审查的生效;2019.03.15#公开

摘要:本发明涉及一种数据记录筛选方法和装置,所述筛选方法包括:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本发明所述的数据记录筛选方法采用求取差值的方式来确定待筛选的每条数据记录的记录时间与目标时间之间的距离;当所述差值满足要求时,确定出对应的数据记录即为目标数据记录,从而完成在无序的大量数据记录中,筛选出目标数据记录的目的。本发明所述的筛选方法时间复杂度仅为2n,与现有技术先排序再筛选的方式相比,大大降低了计算时间,有利于提高网络对数据的高速处理,提高用户体验。

主权项:1.一种数据记录筛选方法,其特征在于,包括:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录;还包括:接收筛选目标数据记录的指令,所述指令中包含目标信息,以及,根据所述目标信息获取目标时间;或者,获取预先设置的目标时间;其中,在接收所述指令时,所述方法还包括:对所述多条数据记录分别增加一个扩展字段,并在所述扩展字段中写入所述目标信息;所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:将所述时间差值的绝对值小于或等于阈值的数据记录,确定为目标数据记录。

全文数据:数据记录筛选方法和装置技术领域本发明涉及通信网络技术领域,具体涉及一种数据记录筛选方法和装置。背景技术随着科学技术的不断发展,当今社会生活中每时每刻都进行着数据的产生和数据的传输。在通信网络中,两个或多个网络设备与服务器连接,以实现数据资源的交互。能够实现上述功能的通信网络可以包括局域网、广域网或无线局域网、通用分组无线业务网络以及因特网。所述网络设备可以是计算机、蜂窝电话、对讲机、卫星电话、无线电发射机、微处理器或者任何其它需要一个或多个资源来运行的通信处理设备。比如,装有GPRSGeneralPacketRadioService,通用分组无线服务模块的电子设备,多个这种电子设备与服务器组成了一个通信网络。在工作中,每个GPRS模块会向服务器发送数据,用以记录电子设备当前的状态。比如,在网络运行中,当电子设备运行故障时,会第一时间向服务器上报该电子设备的工作日志。将GPRS模块向服务器发送一次数据看作为一条数据,由于GPRS模块每次向服务器发送数据时对应的网络通信质量是变化的,以致于对于多条数据,服务器接收到数据的先后时间顺序并不是与GPRS模块发送数据的时间先后顺序一致的。而服务器在对接收到的数据进行处理时,常常想要获取到电子设备某一个时间段内发送的数据,以便对该时间段内的数据进行下一步处理。由于电子设备发送过来的数据记录中包含记录时间数据记录被发送时对应的时间,但记录时间是随机分布的;现有技术会对其按照记录时间进行排序,然后,再以要查找的目标时间为基点向前和向后选择预设时间段的记录作为筛选出来的目标记录。现有技术在对数据进行处理的过程中,需要对数据记录进行排序,排序的时间复杂度为n2。服务器上的数据是海量的,对于数据的处理时长是衡量一个网络优劣的重要因素。现有技术中对数据的处理方法耗时长,不利于网络对数据的高速处理,用户体验差。发明内容有鉴于此,本发明的目的在于克服现有技术的不足,提供一种数据记录筛选方法和装置。为实现以上目的,本发明采用如下技术方案:一种数据记录筛选方法,包括:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。可选的,该方法还包括:接收筛选目标数据记录的指令,所述指令中包含目标信息,以及,根据所述目标信息获取目标时间;或者,获取预先设置的目标时间。可选的,在接收所述指令时,所述方法还包括:对所述多条数据记录分别增加一个扩展字段,并在所述扩展字段中写入所述目标信息。可选的,所述根据所述目标信息获取目标时间,包括:从所述扩展字段中读取所述目标信息,并根据所述目标信息获取目标时间。可选的,该方法还包括:将增加了扩展字段的数据记录显示给用户。可选的,所述根据所述目标信息获取目标时间,包括:如果所述目标信息为时间信息,则将所述时间信息确定为目标时间;或者,如果所述目标信息为数据记录的标识信息时,则在所述多条数据记录中获取所述标识信息对应的数据记录,并将所述标识信息对应的数据记录中所包含的记录时间确定为目标时间。可选的,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:将所述时间差值的绝对值小于或等于阈值的数据记录,确定为目标数据记录。可选的,所述阈值是从接收的指令中获取的,或者,是预先设置的。可选的,在所述对所述多条数据记录分别增加一个扩展字段,包括:将所述多条数据记录放入一个DataFrame类,再调用DataFrame类的withCloumn方法,分别对每条数据记录增加一个扩展字段。可选的,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:调用DataFrame类的filter方法,根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。可选的,所述每条数据记录均包括:标识信息、记录的具体内容信息以及记录时间。本发明还提供了一种数据记录筛选装置,包括:获取模块,用于获取待筛选的多条数据记录,每条数据记录中包含记录时间;计算模块,用于分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;筛选模块,用于根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本发明还提供了一种终端设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本发明采用以上技术方案,所述数据记录筛选方法,包括:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本发明所述的数据记录筛选方法采用求取差值的方式来确定待筛选的每条数据记录的记录时间与目标时间之间的距离;当所述差值满足要求时,确定出对应的数据记录即为目标数据记录,从而完成在无序的大量数据记录中,筛选出目标数据记录的目的。本发明所述的筛选方法时间复杂度仅为2n,与现有技术先排序再筛选的方式相比,大大降低了计算时间,有利于提高网络对数据的高速处理,提高用户体验。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明数据记录筛选方法实施例一的流程示意图;图2是本发明数据记录筛选方法实施例二的流程示意图;图3是本发明数据记录筛选方法实施例二中待筛选的多条数据记录的结构示意图;图4a是本发明数据记录筛选方法实施例二中的一种可选的中间处理过程示意图;图4b是本发明数据记录筛选方法实施例二中的另一种可选的中间处理过程示意图;图5是本发明数据记录筛选方法实施例三的流程示意图;图6是本发明数据记录筛选装置实施例一的结构示意图。图中:1、获取模块;2、计算模块;3、筛选模块。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。图1是本发明实施例一提供的数据记录筛选方法的流程示意图。如图1所示,本实施例的方法包括:S11:获取待筛选的多条数据记录,每条数据记录中包含记录时间;进一步的,所述每条数据记录均包括:标识信息、记录的具体内容信息以及记录时间。S12:分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;进一步的,所述目标时间可以是该方法预先已经设置的目标时间;或者是,从接受的筛选指令中获取出来的目标时间。S13:根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。进一步的,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:先计算所述时间差值的绝对值;再将所述时间差值的绝对值小于或等于阈值的数据记录,确定为目标数据记录。进一步的,所述阈值是从接收的筛选指令中获取的,或者,是预先设置的。本实施例在实际使用中,比如,已获取n条待筛选的数据记录,按照本实施例所述的方法,分别计算每一条数据记录的记录时间与目标时间之间的时间差值,该计算过程的时间复杂度为n;再将该n个时间差值的绝对值分别与阈值进行比较,从而判断将符合要求的对应的数据记录确定为目标数据记录,该判断比较的过程时间负载度为n,则该实施例所述筛选方法的时间复杂度为2n。本实施例所述的数据记录筛选方法采用求取差值的方式来确定待筛选的每条数据记录的记录时间与目标时间之间的距离,当所述差值满足要求时,确定出对应的数据记录即为目标数据记录,从而完成在无序的大量数据记录中,筛选出目标数据记录的目的。本实施例所述的筛选方法时间复杂度仅为2n,与现有技术先排序再筛选的方式相比,大大降低了计算时间,有利于提高网络对数据的高速处理,提高用户体验。图2是本发明实施例二提供的数据记录筛选方法的流程示意图。如图2所示,本实施例的方法包括:S21:接收筛选目标数据记录的指令;进一步的,所述指令中包含目标信息。S22:获取待筛选的多条数据记录;进一步的,所述每条数据记录均包括:标识信息、记录的具体内容信息以及记录时间。S23:对所述多条数据记录分别增加一个扩展字段,并在所述扩展字段中写入所述目标信息;S24:从所述扩展字段中读取所述目标信息,并根据所述目标信息获取目标时间;进一步的,所述根据所述目标信息获取目标时间,包括:如果所述目标信息为时间信息,则将所述时间信息确定为目标时间;或者,如果所述目标信息为数据记录的标识信息时,则在所述多条数据记录中获取所述标识信息对应的数据记录,并将所述标识信息对应的数据记录中所包含的记录时间确定为目标时间;S25:分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;S26:根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。进一步的,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:将所述时间差值的绝对值小于或等于阈值的数据记录,确定为目标数据记录。进一步的,所述阈值是从接收的指令中获取的,或者,是预先设置的。如图3和图4a所示,本实施例在实际执行时,接收上层下发的筛选目标数据计算的指令,比如该指令中包含的目标信息是11:02:56,则对所述多条数据记录分别增加一个扩展字段图4a中第4列时,所述扩展字段中写入11:02:56,在筛选时,由于11:02:56是一个时间信息,所以将该时间信息确定为目标时间;并分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值即图4a中第4列与第3列上时间的差值;再根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。如图3和图4b所示,本实施例在实际执行时,接收上层下发的筛选目标数据计算的指令,比如该指令中包含的目标信息是第100条数据记录,则对所述多条数据记录分别增加一个扩展字段图4b中第4列时,所述扩展字段中写入100,在筛选时,由于100是一个标识信息,则在所述多条数据记录中获取标识信息为100的数据记录,并将该第100条数据记录中所包含的记录时间确定为目标时间;并分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;再根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本实施例在实际使用中,比如,已获取n条待筛选的数据记录,现上层下发的筛选指令是要在该n条待筛选的数据记录中筛选出距离时间11:02:56相差2秒内的所有数据记录。则先将目标信息是11:02:56写入扩展字段中,由于扩展字段本身就是一个时间信息,所以将该时间信息确定为目标时间,则目标时间为11:02:56;再分别计算目标时间与每一条待筛选的数据记录的记录时间的时间差;再根据所述时间差值与阈值2秒的大小关系,筛选出目标数据记录。当目标信息为数据记录的标识信息时,所述处理方法与上段类似,在此不再赘述。按照本实施例所述的方法,分别计算每一条数据记录的记录时间与目标时间之间的时间差值,该计算过程的时间复杂度为n;再将该n个时间差值的绝对值分别与阈值进行比较,从而判断将符合要求的对应的数据记录确定为目标数据记录,该判断比较的过程时间负载度为n,则该实施例所述筛选方法的时间复杂度为2n。本实施例所述的数据记录筛选方法利用新增扩展字段的方式能够提高计算数据记录时间与目标时间之间差值的效率,而且通过新增扩展字段也便于用户的查看。本实施例所述的筛选方法时间复杂度仅为2n,大大降低了计算时间,有利于提高网络对数据的高速处理,提高用户体验。需要说明的是,本实施例在执行时,不限于只新增一个扩展字段,在实际使用中,根据筛选目标数据记录的指令要求,可以同时新增多个扩展字段,对应的,用于判断差值大小的阈值的个数也相应的与扩展字段匹配。图5是本发明实施例三提供的数据记录筛选方法的流程示意图。如图5所示,本实施例的方法包括:S51:接收筛选目标数据记录的指令;进一步的,所述指令中包含目标信息。S52:获取待筛选的多条数据记录;进一步的,所述每条数据记录均包括:标识信息、记录的具体内容信息以及记录时间。S53:将所述待筛选的多条数据记录放入一个DataFrame类,再调用DataFrame类的withCloumn方法,分别对每条数据记录增加一个扩展字段,并在所述扩展字段中写入所述目标信息;S54:从所述扩展字段中读取所述目标信息,并根据所述目标信息获取目标时间;进一步的,所述根据所述目标信息获取目标时间,包括:如果所述目标信息为时间信息,则将所述时间信息确定为目标时间;或者,如果所述目标信息为数据记录的标识信息时,则在所述多条数据记录中获取所述标识信息对应的数据记录,并将所述标识信息对应的数据记录中所包含的记录时间确定为目标时间;S55:分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;S56:调用DataFrame类的filter方法,根据所述时间差值,在所述多条数据记录中筛选出目标数据记录;进一步的,调用DataFrame类的filter方法时,所用的过滤条件为:所述时间差值的绝对值小于或等于阈值;其中,所述阈值是从接收的指令中获取的,或者,是预先设置的。S57:将增加了扩展字段的数据记录以及筛选出的目标数据记录显示给用户。本实施例中步骤S56所述阈值是从接收的指令中获取的,步骤S56所述的指令指的是上层下发的筛选指令,可以理解的是,为了获取阈值,该指令不仅限于是筛选指令,也可以是专门的设置阈值的指令,或者其他指令。本实施例在实际执行时,与实施例二的区别在于:当本实施例应用在大数据开发环境中时,将所述待筛选的多条数据记录放入一个DataFrame类,再调用DataFrame类的withCloumn方法,分别对每条数据记录增加一个扩展字段。此外,根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,这一步骤的处理上,本实施例可调用DataFrame类的filter方法,根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。本实施例所述的数据记录筛选方法,当在大数据开发环境中执行时,能够充分利用开发环境现有的数据函数完成扩展字段的增加,以及对所述时间差值的筛选,能够使开发人员在开发该方法对应的工程代码时实现起来更加简单,且有利于所述数据记录筛选方法更加高效执行。本实施例所述的筛选方法时间复杂度仅为2n,大大降低了计算时间,有利于提高网络对数据的高速处理,提高用户体验。如图6所示,本发明还提供了一种数据记录筛选装置的实施方式,实施例一所述的筛选装置包括:获取模块1,用于获取待筛选的多条数据记录,每条数据记录中包含记录时间;计算模块2,用于分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;筛选模块3,用于根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。进一步的,所述筛选装置还可以包括:指令接收模块,用于接收筛选目标数据记录的指令,所述指令中包含目标信息。本实施例的工作原理可参见上述实施例一至实施例三中的任一项的工作原理。此外,本发明还提供了一种终端设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。所述终端设备在对待筛选的多条数据记录进行目标数据记录筛选时,能够采用求取差值的方式来确定待筛选的每条数据记录的记录时间与目标时间之间的距离;当所述差值满足要求时,确定出对应的数据记录即为目标数据记录,从而完成在无序的大量数据记录中,筛选出目标数据记录的目的。本终端设备所执行的筛选方法时间复杂度仅为2n,与现有技术先排序再筛选的方式相比,大大降低了计算时间,有利于提高终端设备对目标数据筛选的处理速度,提高用户体验。可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列PGA,现场可编程门阵列FPGA等。本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

权利要求:1.一种数据记录筛选方法,其特征在于,包括:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。2.根据权利要求1所述的方法,其特征在于,还包括:接收筛选目标数据记录的指令,所述指令中包含目标信息,以及,根据所述目标信息获取目标时间;或者,获取预先设置的目标时间。3.根据权利要求2所述的方法,其特征在于,在接收所述指令时,所述方法还包括:对所述多条数据记录分别增加一个扩展字段,并在所述扩展字段中写入所述目标信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标信息获取目标时间,包括:从所述扩展字段中读取所述目标信息,并根据所述目标信息获取目标时间。5.根据权利要求3所述的方法,其特征在于,还包括:将增加了扩展字段的数据记录显示给用户。6.根据权利要求2-5任一项所述的方法,其特征在于,所述根据所述目标信息获取目标时间,包括:如果所述目标信息为时间信息,则将所述时间信息确定为目标时间;或者,如果所述目标信息为数据记录的标识信息时,则在所述多条数据记录中获取所述标识信息对应的数据记录,并将所述标识信息对应的数据记录中所包含的记录时间确定为目标时间。7.根据权利要求1所述的方法,其特征在于,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:将所述时间差值的绝对值小于或等于阈值的数据记录,确定为目标数据记录。8.根据权利要求7所述的方法,其特征在于,所述阈值是从接收的指令中获取的,或者,是预先设置的。9.根据权利要求3所述的方法,其特征在于,所述对所述多条数据记录分别增加一个扩展字段,包括:将所述多条数据记录放入一个DataFrame类,再调用DataFrame类的withCloumn方法,分别对每条数据记录增加一个扩展字段。10.根据权利要求9所述的方法,其特征在于,所述根据所述时间差值,在所述多条数据记录中筛选出目标数据记录,包括:调用DataFrame类的filter方法,根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。11.根据权利要求1-5、7-10任一项所述的方法,其特征在于,所述每条数据记录均包括:标识信息、记录的具体内容信息以及记录时间。12.一种数据记录筛选装置,其特征在于,包括:获取模块,用于获取待筛选的多条数据记录,每条数据记录中包含记录时间;计算模块,用于分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;筛选模块,用于根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。13.一种终端设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:获取待筛选的多条数据记录,每条数据记录中包含记录时间;分别计算每条数据记录中包含的记录时间与目标时间之间的时间差值;根据所述时间差值,在所述多条数据记录中筛选出目标数据记录。

百度查询: 珠海格力电器股份有限公司 数据记录筛选方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。