【发明授权】训练集构建方法、装置、电子设备及计算机可读存储介质_中国医学科学院肿瘤医院_201911344538.3

申请/专利权人：中国医学科学院肿瘤医院

申请日：2019-12-23

公开（公告）日：2024-04-23

公开（公告）号：CN111144473B

主分类号：G06V10/774

分类号：G06V10/774;G06V10/764;G06V10/82;G06N3/084;G06N3/09

优先权：

专利状态码：有效-授权

法律状态：2024.04.23#授权;2020.06.05#实质审查的生效;2020.05.12#公开

摘要：本发明涉及一种训练集构建方法、装置、电子设备及计算机可读存储介质，属于数据挖掘领域。该方法包括：构建多个训练集，每构建一个训练集时，计算与当前训练集对应的转移矩阵以及状态序列。后续判断是否满足迭代停止条件；在满足时从已构建的训练集中确定最优训练集；否则继续构建下一个训练集。在上述过程中，通过计算状态序列、转移矩阵，能够清晰地表征出当前所有收敛的神经网络模型对数字病理切片的识别准确率的差异性，然后基于当前得到的状态序列、转移矩阵进行蒙特卡洛重采样更新训练集时，更能拟合总训练集中样本数据的统计分布信息，因此，可以得到尽可能多地表征全部数字病理切片的特征的最优训练集。

主权项：1.一种训练集构建方法，其特征在于，所述方法包括：依次构建多个训练集，每构建一个训练集，计算与当前训练集对应的用于表征所述当前训练集与前一个训练集之间的差异度的转移矩阵以及用于表征总训练集中的各个样本相对于所述当前训练集所确定的概率分布情况的状态序列；判断是否满足迭代停止条件；在满足时，从已构建的训练集中确定出最优训练集；在不满足时，在所述当前训练集的基础上构建下一个训练集；其中，第一个训练集及第二个训练集从所述总训练集中随机采样得到，其余训练集基于前一个训练集的状态序列及所述前一个训练集的转移矩阵采用蒙特卡洛采样法从所述总训练集中采样得到；构建训练集，包括：电子设备先对数字病理切片进行随机切割，得到多个固定尺寸的小图组成正负样本总训练集，电子设备从总训练集中选取多个样本，构建多个训练集；所述计算与当前训练集对应的用于表征所述当前训练集与前一个训练集之间的差异度的转移矩阵以及用于表征总训练集中的各个样本相对于所述当前训练集所确定的概率分布情况的状态序列，包括：计算所述总训练集中的每个样本在已收敛的神经网络模型中的反向传播过程中的梯度值，所述已收敛的神经网络模型由所述当前训练集训练至收敛；将所述总训练集中的每个样本的梯度值离散化，得到所述总训练集中的样本对应于所述当前训练集的状态序列；根据所述总训练集中的样本相对于所述当前训练集的状态序列及所述总训练集中的样本相对于前一个训练集的状态序列，确定所述当前训练集的转移矩阵；所述将所述总训练集中的每个样本的梯度值离散化，得到所述总训练集中的样本对应于所述当前训练集的状态序列，包括：将区间[0,1]等分为K个子区间，每个子区间为一个状态；确定出所述总训练集中的每个样本的梯度值所属的状态；得到所述总训练集中的样本对应于所述当前训练集的状态序列，状态序列用于描述所述总训练集中的每个样本的梯度值所属的状态；其中，当某个样本的梯度值属于k状态时，该样本的梯度值的大小属于子区间，1≤k≤K；所述根据所述总训练集中的样本相对于所述当前训练集的状态序列及所述总训练集中的样本相对于前一个训练集的状态序列，确定所述当前训练集的转移矩阵，包括：比较相对于所述当前训练集的状态序列与相对于前一个训练集的状态序列两者之间的差异度；根据所述差异度构建转移矩阵，其中，用于表征总训练集中的各个样本相对于所述前一个训练集的状态序列中第i个状态的样本集合与所述总训练集中的各个样本相对于当前训练集的状态序列中第j个状态的样本集合之间的转移概率；所述计算所述总训练集中的每个样本在已收敛的神经网络模型中的反向传播过程中的梯度值，包括：针对每个样本，根据所述已收敛的神经网络模型的激活函数，计算该样本被预测为正样本的概率值、被预测为负样本的概率值；针对每个样本，根据其被预测为正样本的概率值、其被预测为负样本的概率值确定该样本在所述已收敛的神经网络模型中的反向传播过程中的梯度值；所述针对每个样本，根据所述神经网络模型的激活函数，计算该样本被预测为正样本的概率值、被预测为负样本的概率值，包括：当所述激活函数为softmax函数时，基于公式计算得到该样本被预测为正样本的概率值、被预测为负样本的概率值；其中，p0、p1分别表示样本被预测为负样本的概率值、被预测为正样本的概率值，所述x0、x1分别表示所述神经网络模型的输出层预测该样本为负样本的预测值、预测该样本为正样本的预测值，e表示自然常数，label为0表示样本被预测为负样本，label为1表示样本被预测为正样本；当所述激活函数为sigmoid函数时，基于公式计算得到该样本被预测为正样本的概率值、被预测为负样本的概率值；其中，p0、p1分别表示样本被预测为负样本的概率值、被预测为正样本的概率值，所述x1表示所述神经网络模型的输出层预测该样本为正样本的预测值，e表示自然常数。

全文数据：

权利要求：

百度查询：中国医学科学院肿瘤医院训练集构建方法、装置、电子设备及计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

下一篇：刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

相关技术

一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

一种风机通风量检测方法及装置_北京农业信息技术研究中心_202110665511.5

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

一种基于数字孪生的加工过程自适应控制方法_东华大学_202111238057.1

一种焊机入口处粉末吹扫装置_张家港扬子江冷轧板有限公司_202111069579.3

基于无监督学习的多视角显著性估计方法_西北工业大学_202011250827.X

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

一种基于准零刚度原理的空气悬架及其结构设计与优化方法_江苏大学_202111438418.7

电子设备相关技术

电子设备和电子设备的控制方法_维沃移动通信有限公司_202110201858.4

电子设备_荣耀终端有限公司_202310183494.0

电子设备_北京国科环宇科技股份有限公司_202410039521.1

电子设备_松下知识产权经营株式会社_202280064941.4

电子设备_OPPO广东移动通信有限公司_202211403490.0

电子设备_荣耀终端有限公司_202311470214.0

电子设备_联想(新加坡)私人有限公司_202010299523.6

电子设备_玳能本股份有限公司_201980098136.1

电子设备_杭州逗酷软件科技有限公司_202211403572.5

电子设备配件_深圳市图拉斯科技有限公司_202322626552.0

计算机相关技术

一种台式计算机用便于安装固定的计算机支架_广西右江民族商业学校_202323002182.X

游戏交互方法、装置、计算机设备及计算机可读存储介质_网易(杭州)网络有限公司_202410269681.5

数据处理方法、装置、计算机存储介质和计算机程序产品_惠州视维新技术有限公司_202410296177.4

车道检测方法、装置、计算机设备及计算机可读存储介质_TCL科技集团股份有限公司_202211407988.4

事件展示方法、装置、计算机设备及计算机可读存储介质_北京全现在信息技术服务有限公司_202010856996.1

直播视频处理方法、计算机设备和计算机可读存储介质_腾讯音乐娱乐科技(深圳)有限公司_202410110749.5

攀爬跳跃方法、装置、计算机设备及计算机可读存储介质_苏州幻塔网络科技有限公司_202010574825.X

装置、方法和计算机程序_诺基亚技术有限公司_202280065920.4

计算机布线固定结构_程少军_202320711669.6

计算机安全保密检查系统_北京卫星环境工程研究所_202311601601.3

装置相关技术

分拣装置的图像采集装置及分拣装置_上海悦峻环保科技有限公司_202321433193.0

分流装置、冷却装置、电池包及用电装置_株式会社AESC日本_202410341764.0

光学装置、图像读取装置及图像形成装置_富士胶片商业创新有限公司_202010080906.4

信息显示装置用光源装置_中光学集团股份有限公司_202410224749.8

车辆用电源装置和门闩装置_美蓓亚三美株式会社_202280062584.8

定影装置以及图像形成装置_京瓷办公信息系统株式会社_202410209288.7

光检测装置及照明装置_林铭钊_201710786021.4

振动装置和振动产生装置_乐金显示有限公司_202311386586.5

开关装置及功率转换装置_三菱电机株式会社_202111021396.4

开关装置和电源切换装置_华为数字能源技术有限公司_202410236053.7

龙图腾网&IPTOP

【发明授权】训练集构建方法、装置、电子设备及计算机可读存储介质_中国医学科学院肿瘤医院_201911344538.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务