【发明公布】一种邻近核心加权度量数据信息评估方法_天津大学_202311666255.7

导航：龙图腾网> 最新专利技术> 一种邻近核心加权度量数据信息评估方法_天津大学_202311666255.7

申请/专利权人：天津大学

申请日：2023-12-07

公开（公告）日：2024-03-29

公开（公告）号：CN117786524A

主分类号：G06F18/2415

分类号：G06F18/2415;G06F18/214

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.16#实质审查的生效;2024.03.29#公开

摘要：数据质量在深度学习中起到决定性作用，在军事和医疗领域等具有敏感性的领域中，数据的获取十分困难，寻找一种能够在少量数据的情况下提高模型性能的方法变得至关重要。为此，本发明提供了一种数据信息评估方法。方法主要步骤包括数据集划分、网络训练、核心权重熵采样、去冗余、加入候选集、标注候选集数据、得到高信息训练集等。其中主要创新点体现在核心权重熵和去冗余两个部分，通过分析特征空间分布，计算核心距离熵，并进行相似性度量，来采样高信息低冗余的数据。本发明可弥补数据信息缺乏评估方法的缺陷，进而可提高神经网络模型的训练效率，解决一些智能任务在部分场景下缺乏大量标注数据的难题。

主权项：1.一种邻近核心加权度量数据信息评估方法数据信息评估方法，其特征在于，所述方法包括：a.将数据集划分训练集和测试集，其中训练集包括已标注和未标注数据；b.构建深度神经网络，并将训练集中的数据输入到网络进行训练；c.设置每个循环的采样预算，在预算内对未标注数据按批次进行评估，每个批次利用邻近核心加权度量数据信息评估方法分批次挑选高信息数据；d.在每个批次的评估中，利用邻近核心加权度量方法得到的评分高的数据利用去冗余方法进行去冗余。e.根据邻近核心加权度量和去冗余方法选择高信息且不冗余的数据加入候选集，进行人工标注；f.将已标注的数据加入到训练集中，进行下一轮循环；g.重复步骤b-e，直到未标注数据为空或者达到标注样本需求量，最终得到完整候选集。

全文数据：

权利要求：

百度查询：天津大学一种邻近核心加权度量数据信息评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

下一篇：一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

相关技术

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

龙图腾网&IPTOP

【发明公布】一种邻近核心加权度量数据信息评估方法_天津大学_202311666255.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务