买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种数据处理方法和装置_中国人民解放军空军研究院战略预警研究所_201910075206.3 

申请/专利权人:中国人民解放军空军研究院战略预警研究所

申请日:2019-01-25

公开(公告)日:2021-04-27

公开(公告)号:CN109799483B

主分类号:G01S7/02(20060101)

分类号:G01S7/02(20060101);G01S7/28(20060101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.04.27#授权;2019.06.18#实质审查的生效;2019.05.24#公开

摘要:本申请实施例提供了一种数据处理方法和装置,其中,该方法包括:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。通过上述方法,由于降低了雷达全脉冲数据的数据量大小,因此有利于降低在存储雷达全脉冲数据时所占用的存储资源。

主权项:1.一种数据处理方法,其特征在于,包括:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角;根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值和预设的哈夫曼Huffuman编码表,对聚类结果进行Huffuman编码;对所述预设编码表、所述聚类结果和编码结果进行存储。

全文数据:一种数据处理方法和装置技术领域本申请涉及计算机技术领域,具体而言,涉及一种数据处理方法和装置。背景技术雷达全脉冲数据是电子侦察设备侦察到的一种雷达数据,为了对获取到的雷达全脉冲数据进行详细分析,需要在获取到雷达全脉冲数据之后,对该雷达全脉冲数据进行存储,但是由于获取的雷达全脉冲数据的数据量较大,因此在对雷达全脉冲数据进行存储时,会占用较多的存储资源。发明内容有鉴于此,本申请实施例的目的在于提供一种数据处理方法和装置,以降低雷达全脉冲数据占用的存储资源。主要包括以下几个方面:第一方面,本申请实施例提供了一种数据处理方法,包括:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。可选地,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角。可选地,所述利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类,包括:以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心;将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中;根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组;计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差;计算各所述之差的总和;判断所述总和是否小于预设精度值;如果小于或者等于所述精度值,确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中;计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类;其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。可选地,在所述判断所述总和是否小于预设精度值之后,所述方法还包括:如果大于所述精度值,则继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。可选地,所述根据预设编码表,对聚类结果进行编码,包括:根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。第二方面,本申请实施例提供了一种数据处理装置,包括:聚类单元,用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;编码单元,用于根据预设编码表,对聚类结果进行编码;存储单元,用于对所述预设编码表、所述聚类结果和编码结果进行存储。可选地,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角。可选地,在所述聚类单元用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类时,包括:以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心;将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中;根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组;计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差;计算各所述之差的总和;判断所述总和是否小于预设精度值;如果小于或者等于所述精度值,确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中;计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类;其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。可选地,所述聚类单元,还用于:在判断所述总和是否小于预设精度值之后,如果大于所述精度值,则继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。可选地,在所述编码单元用于根据预设编码表,对聚类结果进行编码时,包括:根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。第三方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行以下步骤:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行以下步骤:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。本申请的实施例提供的技术方案可以包括以下有益效果:在本申请实施例中,由于雷达全脉冲数据是由多个子脉冲数据构成的,因此,可以通过降低各子脉冲数据所需要的存储资源,来实现降低雷达全脉冲数据占用的存储资源,并且由于不同的子脉冲数据具有不同的特征参数信息,因此在获取到雷达全脉冲数据后,利用该雷达全脉冲数据中的各子脉冲数据的特征参数信息,对各子脉冲数据进行聚类,然后根据预设编码表,对聚类结果进行编码,通过以上步骤完成了对雷达全脉冲数据进行聚类压缩,从而有利于降低在对雷达全脉冲数据进行存储时所占用的存储空间,并且为了能够在后续对聚类压缩的雷达全脉冲数据进行解压,以还原雷达全脉冲数据,从而实现对雷达全脉冲数据进行分析的目的,在对聚类压缩的雷达全脉冲数据进行存储时,需要将预设编码表、聚类结果和编码结果进行存储。通过上述方法,由于降低了雷达全脉冲数据的数据量大小,因此有利于降低在存储雷达全脉冲数据时所占用的存储资源。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例一提供的一种数据处理方法的流程示意图;图2为本申请实施例一提供的另一种数据处理方法的流程示意图;图3为本申请实施例一提供的另一种数据处理方法的流程示意图;图4为本申请实施例一提供的另一种数据处理方法的流程示意图;图5为本申请实施例二提供的一种数据处理装置的结构示意图;图6为本申请实施例三提供的一种电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“雷达全脉冲数据的聚类压缩”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。本申请的一个方面涉及一种数据处理方法。该方法可以通过对雷达全脉冲数据中的各子脉冲数据进行聚类压缩,来实现降低雷达全脉冲数据在进行存储时所占用的存储资源的目的。值得注意的是,在本申请提出申请之前,相关技术中,在接收到雷达全脉冲数据后,不对该雷达全脉冲数据做任何处理,而使直接对该雷达全脉冲数据进行存储。然而本申请提供的数据处理方法,可以对雷达全脉冲数据中的各子脉冲数据进行聚类压缩,来实现降低雷达全脉冲数据在进行存储时所占用的存储资源的目的。以下通过几个实施例进行具体描述。实施例一图1为本申请实施例一提供的一种数据处理方法的流程示意图,如图1所示,该方法包括以下步骤:步骤101、利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类。具体的,雷达全脉冲数据是由多个子脉冲数据构成的,例如:一个雷达全脉冲数据中可能存在10万个子脉冲数据,其中,不同的子脉冲数据具有不同的特征参数信息,因此可以对各子脉冲数据进行聚类,并且在对子脉冲数据进行聚类时,可以利用各子脉冲数据的特征参数信息进行聚类,以便在后续对各子脉冲数据进行聚类压缩之后,使得各子脉冲数据聚类压缩的结果存在不同。步骤102、根据预设编码表,对聚类结果进行编码。步骤103、对所述预设编码表、所述聚类结果和编码结果进行存储。在本申请实施例中,由于雷达全脉冲数据是由多个子脉冲数据构成的,因此,可以通过降低各子脉冲数据所需要的存储资源,来实现降低雷达全脉冲数据占用的存储资源,并且由于不同的子脉冲数据具有不同的特征参数信息,因此在获取到雷达全脉冲数据后,利用该雷达全脉冲数据中的各子脉冲数据的特征参数信息,对各子脉冲数据进行聚类,然后根据预设编码表,对聚类结果进行编码,通过以上步骤完成了对雷达全脉冲数据进行聚类压缩,从而有利于降低在对雷达全脉冲数据进行存储时所占用的存储空间,并且为了能够在后续对聚类压缩的雷达全脉冲数据进行解压,以还原雷达全脉冲数据,从而实现对雷达全脉冲数据进行分析的目的,在对聚类压缩的雷达全脉冲数据进行存储时,需要将预设编码表、聚类结果和编码结果进行存储。通过上述方法,由于降低了雷达全脉冲数据的数据量大小,因此有利于降低在存储雷达全脉冲数据时所占用的存储资源。在一个可行的实施方案中,为了不占用存储设备的计算资源,可以将聚类压缩操作执行在另一个设备中,下面以存储设备为计算机,聚类压缩设备为DSPDigitalSignalProcessing,数字信号处理设备为例进行说明,图2为本申请实施例一提供的另一种数据处理方法的流程示意图,如图2所示,在计算机获取到雷达全脉冲数据后,该方法包括以下步骤:步骤201、计算机将磁盘文件中的雷达全脉冲数据读取到计算机内存中。具体的,可以通过fopen指令打开磁盘文件,然后读取文件头信号,获得雷达全脉冲数据的大小和位置,然后再根据雷达全脉冲数据的大小和位置,将该雷达全脉冲数据读取到计算机的内存中。步骤202、计算机将计算机内存中的雷达全脉冲数据通过PCIEperipheralcomponentinterconnectexpress,高速串行计算机扩展总线标准总线传输给DSP设备的内存中。步骤203、DSP设备利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对各子脉冲数据进行聚类压缩。步骤204、DSP设备将聚类压缩后的数据通过PCIE传输给计算机的内存中。步骤205、计算机将内存中的数据保存到磁盘文件中。具体的,通过fopen指令打开一个新的磁盘文件,将聚类压缩后的数据的聚类结果和与编码相关的编码信息存储至该新的磁盘文件中。通过上述方法,雷达全脉冲数据的聚类压缩过程执行在DSP设备中,不会占用计算机的计算资源,有利于减少计算机CPUCentralProcessingUnit,中央处理器的负荷,降低对计算机系统的影响,在基本不影响计算机系统正常工作的情况下,有利于提高雷达全脉冲数据的压缩吞吐量。在一个可行的实施方案中,一个子脉冲数据是由五种特征参数信息构成的,该五种特征参数信息分别为:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,因此,可以利用各子脉冲数据的脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,这五种特征参数信息对各子脉冲数据进行聚类压缩。在一个可行的实施方案中,图3为本申请实施例一提供的另一种数据处理方法的流程示意图,如图3所述,在执行步骤101时,可以通过以下步骤实现:步骤301、以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数。以一个雷达脉冲数据包括10个子脉冲数据为例进行说明,其中,K为2,如果指定第一个子脉冲数据和第三个子脉冲数据,可以以第一个子脉冲数据和第三个子脉冲数据未初始聚类中心,根据该10个子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,通过上述公式计算该10个子脉冲数据到第一个子脉冲数据的欧式距离和该10个子脉冲数据到第二个子脉冲数据的欧式距离。需要说明的是,脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角计算顺序可以根据实际需要进行设定,例如,可以将脉冲幅值作为第一个特征参数、脉冲载频作为第二特征参数,脉冲到达角作为第三特征参数,脉冲宽度作为第四特征参数,关于脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角计算顺序在此不做具体限定。步骤302、确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心。步骤303、将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中。以第二子脉冲数据为例,第二子脉冲数据对应两个欧式距离,一个欧式距离是到第一子脉冲数据的欧式距离,另一个欧式距离是到第三子脉冲数据的欧式距离,如果到第一子脉冲数据的欧式距离小于到第三子脉冲数据的欧式距离,则将第一子脉冲数据作为第二子脉冲数据的第一聚类中心,然后将第二子脉冲数据划分至第一子脉冲数据所代表的第一类簇中,其他子脉冲数据的划分方法可参考第二子脉冲数据的划分方法,在此不再详细赘述。步骤304、根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:其中,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。步骤305、按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组。距离说明,当初始聚类中心包括:第一子脉冲数据和第三子脉冲数据,二次聚类中心包括:第四子脉冲数据和第五子脉冲数据时,可以将第一子脉冲数据和第四子脉冲数据配对为一组,将第三子脉冲数据和第四子脉冲数据配对为一组。步骤306、计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差。举例说明,当将第一子脉冲数据和第四子脉冲数据配对为一组,将第三子脉冲数据和第五子脉冲数据配对为一组时,利用第一子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,以及第四子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算第一子脉冲数据和第四子脉冲数据之间的欧式距离,同理,计算第三子脉冲数据和第五子脉冲数据之间的欧式距离。步骤307、计算各所述之差的总和。步骤308、判断所述总和是否小于预设精度值,如果小于或者等于所述精度值,则执行步骤309,如果大于所述精度值,至执行步骤311。需要说明的是,预设精度值可以为1e-6,关于具体的精度值大小还可以根据实际需要进行设定,在此不做具体限定。步骤309、确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中。举例说明,如果上述总和小于或者等于预设精度值,则将第四子脉冲数据和第五子脉冲数据作为二次聚类中心,如果此时,第一子脉冲数据、第二子脉冲数据、第三子脉冲数据和第四子脉冲数据归属的聚类中心为第四子脉冲数据,第五子脉冲数据至第十子脉冲数据归属的聚类中心为第五子脉冲数据,则将第一子脉冲数据至第四子脉冲数据划分到第四子脉冲数据所代表的第二类簇中,将第五子脉冲数据至第十子脉冲数据划分到第五子脉冲数据所代表的第二类簇中。步骤310、计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类。举例说明,第一子脉冲数据至第四子脉冲数据分别和第四子脉冲数据的向量差值,以及计算,第五子脉冲数据至第十子脉冲数据分别和第五子脉冲数据的向量差值,从而实现对第一子脉冲数据至第十子脉冲数据的聚类。步骤311、继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。具体的,如果该总和大于预设精度值,则重新执行步骤301至步骤308,即进行步骤301至步骤308的迭代,直至该总和小于或者等于预设精度值为止,然后再执行步骤309至步骤310。在一个可行的实施方案中,图4为本申请实施例一提供的另一种数据处理方法的流程示意图,如图4所示,在执行步骤102时,可以通过以下步骤实现:步骤401、根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值。具体的,当一个雷达全脉冲数据中包括10个子脉冲数据时,可以计算两个相邻的子脉冲数据之间的脉冲到达时间的时间差值,此时在知道第一个子脉冲数据的脉冲到达时间时,就可以根据上述的时间差值,确定出第二个子脉冲数据至第十个子脉冲数据的脉冲到达时间。步骤402、根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。在一个可行的实施方案中,由于通过第一个子脉冲数据的脉冲到达时间和各子脉冲数据之间的脉冲到达时间差值,可以确定出各子脉冲数据的脉冲到达时间,根据预设编码表、编码结果和聚类结果,可以确定出各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,通过上述方法可以实现对雷达全脉冲数据的解压缩,从而可以得到原始的雷达全脉冲数据。实施例二图5为本申请实施例二提供的一种数据处理装置的结构示意图,如图5所示,该装置包括:聚类单元501,用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;编码单元502,用于根据预设编码表,对聚类结果进行编码;存储单元503,用于对所述预设编码表、所述聚类结果和编码结果进行存储。在一个可行的实施方案中,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角。在一个可行的实施方案中,在所述聚类单元501用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类时,包括:以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心;将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中;根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组;计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差;计算各所述之差的总和;判断所述总和是否小于预设精度值;如果小于或者等于所述精度值,确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中;计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类;其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。在一个可行的实施方案中,所述聚类单元501,还用于:在判断所述总和是否小于预设精度值之后,如果大于所述精度值,则继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。在一个可行的实施方案中,在所述编码单元502用于根据预设编码表,对聚类结果进行编码时,包括:根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。关于上述单元的详细介绍可参考实施例一的相关说明,在此不再详细赘述。在本申请实施例中,由于雷达全脉冲数据是由多个子脉冲数据构成的,因此,可以通过降低各子脉冲数据所需要的存储资源,来实现降低雷达全脉冲数据占用的存储资源,并且由于不同的子脉冲数据具有不同的特征参数信息,因此在获取到雷达全脉冲数据后,利用该雷达全脉冲数据中的各子脉冲数据的特征参数信息,对各子脉冲数据进行聚类,然后根据预设编码表,对聚类结果进行编码,通过以上步骤完成了对雷达全脉冲数据进行聚类压缩,从而有利于降低在对雷达全脉冲数据进行存储时所占用的存储空间,并且为了能够在后续对聚类压缩的雷达全脉冲数据进行解压,以还原雷达全脉冲数据,从而实现对雷达全脉冲数据进行分析的目的,在对聚类压缩的雷达全脉冲数据进行存储时,需要将预设编码表、聚类结果和编码结果进行存储。通过上述方法,由于降低了雷达全脉冲数据的数据量大小,因此有利于降低在存储雷达全脉冲数据时所占用的存储资源。实施例三图6为本申请实施例三提供的一种电子设备的结构示意图,包括:处理器601、存储介质602和总线603,所述存储介质602存储有所述处理器601可执行的机器可读指令,当电子设备运行上述的数据处理方法时,所述处理器601与所述存储介质602之间通过总线603通信,所述处理器601执行所述机器可读指令,以执行以下步骤:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。实施例四本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行以下步骤:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述数据处理方法,通过上述方法,可以通过对雷达全脉冲数据中的各子脉冲数据进行聚类压缩,来实现降低雷达全脉冲数据在进行存储时所占用的存储资源的目的。本申请实施例所提供的数据处理方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备可以是个人计算机,服务器,或者网络设备等执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

权利要求:1.一种数据处理方法,其特征在于,包括:利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;根据预设编码表,对聚类结果进行编码;对所述预设编码表、所述聚类结果和编码结果进行存储。2.如权利要求1所述的方法,其特征在于,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角。3.如权利要求2所述的方法,其特征在于,所述利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类,包括:以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心;将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中;根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组;计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差;计算各所述之差的总和;判断所述总和是否小于预设精度值;如果小于或者等于所述精度值,确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中;计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类;其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。4.如权利要求3所述的方法,其特征在于,在所述判断所述总和是否小于预设精度值之后,所述方法还包括:如果大于所述精度值,则继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。5.如权利要求3或4所述的方法,其特征在于,所述根据预设编码表,对聚类结果进行编码,包括:根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。6.一种数据处理装置,其特征在于,包括:聚类单元,用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类;编码单元,用于根据预设编码表,对聚类结果进行编码;存储单元,用于对所述预设编码表、所述聚类结果和编码结果进行存储。7.如权利要求6所述的装置,其特征在于,所述特征参数信息包括:脉冲到达时间、脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角。8.如权利要求7所述的装置,其特征在于,在所述聚类单元用于利用雷达全脉冲数据中的各子脉冲数据的特征参数信息,对所述各子脉冲数据进行聚类时,包括:以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,采用以下公式计算各子脉冲数据与各初始聚类中心之间的欧式距离:确定所述欧式距离中该子脉冲数据与所述各初始聚类中心之间距离最小的欧式距离,以将该距离最小的欧式距离对应的初始聚类中心作为该子脉冲数据的第一聚类中心;将该子脉冲数据划分到所述第一聚类中心所代表的第一类簇中;根据所述第一类簇,利用如下公式重新计算K个二次聚类中心:按照所述初始聚类中心的先后顺序和所述二次聚类中心的先后顺序,对所述初始聚类中心和所述二次聚类中心依次配对成组;计算各组中的初始聚类中心和二次聚类中心之间的欧式距离之差;计算各所述之差的总和;判断所述总和是否小于预设精度值;如果小于或者等于所述精度值,确定所述二次聚类中心中该子脉冲数据所归属的二次聚类中心,以将该子脉冲数据划分到该二次聚类中心所代表的第二类簇中;计算各所述第二类簇中,该子脉冲数据和其对应的二次聚类中心的向量差值,以对所述各子脉冲数据进行聚类;其中,XP和Xq分别表示两个不同的子脉冲数据,XPh和Xqh分别表示该两个子脉冲数据的第h个特征参数,h为小于等于4的正整数,第一个特征参数为脉冲宽度,第二个特征参数为脉冲幅值,第三个特征参数为脉冲载频,第四个特征参数为脉冲到达角,K为小于子脉冲数据数量的正整数,Mi表示第i个第二类簇的二次聚类中心,Ni表示第i个第二类簇中的子脉冲数据的数量,xij表示第i个第二类簇中第j个子脉冲数据。9.如权利要求8所述的装置,其特征在于,所述聚类单元,还用于:在判断所述总和是否小于预设精度值之后,如果大于所述精度值,则继续执行以K个指定的子脉冲数据作为初始聚类中心,根据所述各子脉冲数据的脉冲宽度、脉冲幅值、脉冲载频和脉冲达到角,计算各子脉冲数据与各初始聚类中心之间的欧式距离的步骤,直至所述总和小于或者等于所述精度值为止。10.如权利要求8或9所述的装置,其特征在于,在所述编码单元用于根据预设编码表,对聚类结果进行编码时,包括:根据所述各子脉冲数据的脉冲到达时间,确定相邻子脉冲数据之间的脉冲到达时间差值;根据所述时间差值、所述向量差值和预设的哈夫曼Huffuman编码表,进行Huffuman编码。

百度查询: 中国人民解放军空军研究院战略预警研究所 一种数据处理方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。