【发明授权】一种海洋渔场渔情预报系统中的缺失数据填补方法及系统_大连海事大学_202110195665.2

导航：龙图腾网> 最新专利技术> 一种海洋渔场渔情预报系统中的缺失数据填补方法及系统_大连海事大学_202110195665.2

申请/专利权人：大连海事大学

申请日：2021-02-19

公开（公告）日：2023-05-16

公开（公告）号：CN112835884B

主分类号：G06F16/215

分类号：G06F16/215;G06F16/2455;G06Q50/02

优先权：

专利状态码：有效-授权

法律状态：2023.05.16#授权;2021.06.11#实质审查的生效;2021.05.25#公开

摘要：本发明提供一种海洋渔场渔情预报系统中的缺失数据填补方法，包括以下步骤：步骤1：数据实时获取：给定传感器网络监测区域内的n个数据源，将数据源获取到的数据从传感器节点经由传感器网络端传送到服务器端，实现数据流的实时获取；步骤2：模型初始化：对于获取到的包含大量缺失值的实时数据流，进行填补模型初始化、近邻参数初始化、增量更新填补模型及相关参数更新；步骤3：查询响应处理：基于经过步骤2填补后得到的完整的数据流，对用户的查询进行快速响应，从而得到所需要的海洋渔场数据，进行后续的渔场渔情预报分析。本发明的技术方案解决了现有技术中的填补方法无法适应高速动态数据流的问题。

主权项：1.一种海洋渔场渔情预报系统中的缺失数据填补方法，其特征在于，包括以下步骤：步骤1：数据实时获取：给定传感器网络监测区域内的n个数据源包括完整数据元组和缺失数据元组，将数据源获取到的数据从传感器节点经由传感器网络端传送到服务器端，实现数据流的实时获取；步骤1-1：t时刻，对来自n个数据源的历史数据进行数据整合，并将其作为当前时刻的数据集St；步骤1-2：基于步骤1-1获取到的数据集St，进行属性划分，属性Am为缺失属性，其余属性F＝{A1,A2,...,Am-1}为完整属性；步骤1-3：将数据集St分类为缺失数据集和完整数据集两部分，分别由t时刻获取的缺失数据元组和完整数据元组组成；步骤2：模型初始化：对于获取到的包含大量缺失值的实时数据流，进行填补模型初始化、近邻参数初始化、增量更新填补模型及相关参数更新；步骤2-1：对数据集进行归一化预处理操作，把数据变成0，1之间的小数；步骤2-2：进行线性回归模型初始化，针对每条数据元组构建相应的线性回归模型并学习模型参数参数基于学习得到，表示的p近邻；对于数据元组其缺失属性和完整属性间的线性回归模型如下式所示：给定一个的最优p值pi，利用在完整属性上的观测值在St中查找与其相似度最高的pi条近邻元组，表示为进而可基于下式进行求解：其中Xt是由的p近邻在m-1维完整属性上的观测值组成的pi×m的矩阵，Xt中第一列为全1向量，对应中的常量参数Yt是由的pi近邻在缺失维属性上的观测值组成的pi×1的矩阵；步骤2-3：通过枚举法为每条数据元组确定最优的p值并进行p近邻查找；首先基于给定的相似性度量准则计算每条缺失数据元组与其他数据元组间的相似度，得到大小为n×n的二维相似表，基于二维相似表可对每条数据元组的近邻进行查找；对于每个可能的pi取值，均可基于相应的p近邻学习一个对应的线性回归模型，相应地，基于该线性回归模型，结合缺失元组的完整属性值Xt，根据下式即可得到在缺失属性上的估计值Yt；默认初始时刻的数据集为完整数据集，通过计算估计值和完整数据集间的偏差，选择偏差最小的pi值作为最优p值；步骤2-4：为缺失数据元组确定最优的k值并进行k近邻查找；当一条数据元组中缺失属性上的观测值为缺失状态时，首先确定缺失数据元组的最优k值并进行k近邻查找，然后根据确定的k近邻对应的线性回归模型对缺失值进行估计，得到k个估计值；在确定对应的最优k值过程中，假设为缺失数据元组，其近邻参数ki的取值范围为[1,n]；对于每个可能的ki值，均可基于其ki近邻对应的线性回归模型得到一个填补结果，通过选取填补结果与完整数据集间偏差最小的ki值最为最优k值；步骤2-5：模型更新，增量计算当前时刻所在时间周期的平均累计误差，判断周期时长，若平均累积误差大于给定阈值，则重复进行步骤2-2至步骤2-4直至平均累计误差小于等于给定阈值，否则进入步骤2-6；首先基于当前周期内确定的最优k近邻对时间周期T即[t-l,t-1]时间段内填补结果的平均累积误差进行估计；若平均累积误差小于给定阈值τ，即则无需对当前最优p近邻和最优k近邻进行更新；若平均累积误差超过给定阈值τ，即则需在t时刻对每条数据元组的最优p近邻和最优k近邻都进行重新计算，同时，当前时间周期结束，下一个新的时间周期开始；设t时刻缺失数据元组在缺失属性上的真值为估计值为其填补误差为则在时间周期T内所有缺失数据元组填补结果的平均累积误差为：其中l为当前时间周期T的长度，Nm为当前时间周期内所有缺失数据元组数量，即在时间周期T内完整数据集对应的平均累积误差为：其中Nc为当前时间周期内所有完整数据元组数量，即步骤2-6：对完整数据集中的每条完整数据元组对应的回归模型参数进行增量更新；对于t时刻到达的一条数据元组设和为数据元组从初始时刻到当前时刻所有完整近邻组成的X和Y数据矩阵，即对公式2进行增量计算，设：其中是大小为m×m的矩阵，是大小为m×1的矩阵；数据元组对应的回归模型参数可基于下式进行增量计算：其中E为和同等大小的单位矩阵；和可基于下式进行增量计算：步骤2-7：对每条缺失数据元组利用当前数据集中完整近邻数据元组，进行数据中的缺失值填补，形成不包含缺失值的完整数据流；基于当前时刻每条数据元组的最优回归模型参数及最优k近邻集合针对t时刻的每条缺失数据元组首先依据其k近邻对应的线性回归模型得到ki个填补值，最后对ki个填补值进行加权融合得到最终的填补结果；步骤3：查询响应处理：基于经过步骤2填补后得到的完整的数据流，对用户的查询进行快速响应，从而得到所需要的海洋渔场数据，进行后续的渔场渔情预报分析。

全文数据：

权利要求：

百度查询：大连海事大学一种海洋渔场渔情预报系统中的缺失数据填补方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

下一篇：一种气辅实验用控制台_郑州金泰制罐有限公司_202322646692.4

相关技术

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种气辅实验用控制台_郑州金泰制罐有限公司_202322646692.4

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种装饰线条切割装置_安徽哲诚建筑工程有限公司_202322634078.6

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

便携式储能电源_昆吾华兴(北京)能源科技发展有限公司_202322550526.4

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

系统相关技术

显示系统_华为技术有限公司_202110898215.X

开采系统_地下萃取技术私人有限公司_201980058102.X

供热系统_瑞纳智能设备股份有限公司_202322452572.0

热泵系统_青岛海尔空调电子有限公司_202211295395.3

EGR系统_赛力斯集团股份有限公司_202211341129.X

空调系统_宁波奥克斯电气股份有限公司_202322434517.9

破碎系统_内蒙古金辉稀矿有限公司_202322202710.X

液压系统的过滤方法、液压系统及作业机械_三一重机有限公司_202110610891.2

叉车车载电源系统和叉车充电系统_深圳市雄韬锂电有限公司_201911407557.6

用于协助用户配置照明系统的系统及方法_昕诺飞控股有限公司_202080041251.8

预报相关技术

延长地球静止轨道通信卫星两行星历预报时段方法_中国科学院国家天文台_202011366657.1

固态复合调味料鲜美度生津感感官评价分值的定量预报方法_上海太太乐食品有限公司_202110909058.8

一种温室番茄灰霉病发生概率预报方法_山东京博农化科技股份有限公司_202111446722.6

一种棉花蚜虫遥感预报模型的构建方法_新疆农业大学_202210208227.X

一种降水预报订正方法、装置、设备及介质_南京信息工程大学_202311728767.1

一种无线的道岔尖轨断裂监测预报警系统_西安铁路信号有限责任公司_202410014553.6

水面飞行器在波浪水面滑行运动响应的预报方法和装置_中国特种飞行器研究所_202311867358.X

一种基于改进KNN的多模型组合径流预报方法_中国电建集团华东勘测设计研究院有限公司_202311699579.0

一种干平整轧制过程中暗纹缺陷预报方法_衡水板业包装材料科技有限公司_202311730850.2

一种基于动态反演排放源数据的空气质量预报系统_北京众蓝科技有限公司_201910936644.4

中的相关技术

运动的对象流中的对象的检测_西克股份公司_202311366013.6

窄边中挺隔热条及中挺结构_佛山市千细时代建筑科技有限公司_202322038146.2

电镀装置中的电流密度的控制_朗姆研究公司_202010770564.9

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

动态消息处理和消息传递中的数据聚合_利维帕尔森有限公司_202080024885.2

ONO工艺中的HTO氧化层工艺方法_上海华虹宏力半导体制造有限公司_202110719394.6

LTE/NR共存中的CSI参考信令_瑞典爱立信有限公司_201880094231.X

虚拟或增强现实场景中的动态通知呈现_索尼互动娱乐股份有限公司_202280060270.4

本机应用程序中的网页管理_微软技术许可有限责任公司_202280060295.4

减少对象的X射线投影图像中的散射的方法和成像系统_西门子医疗国际股份有限公司_202311358896.6

龙图腾网&IPTOP

【发明授权】一种海洋渔场渔情预报系统中的缺失数据填补方法及系统_大连海事大学_202110195665.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务