【发明授权】一种单隐层ReLU神经网络局部极小值的求解方法_北京工业大学_202110187212.5

导航：龙图腾网> 最新专利技术> 一种单隐层ReLU神经网络局部极小值的求解方法_北京工业大学_202110187212.5

申请/专利权人：北京工业大学

申请日：2021-02-10

公开（公告）日：2024-02-27

公开（公告）号：CN112926727B

主分类号：G06N3/048

分类号：G06N3/048;G06N3/0499;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.02.27#授权;2021.06.25#实质审查的生效;2021.06.08#公开

摘要：一种单隐层ReLU神经网络局部极小值求解方法，属于深度学习理论领域，用于解决ReLU神经网络优化的不确定性的问题，包括构建单隐层ReLU神经网络；利用输入样本和ReLU激活函数的特性进行权值空间区域度划分，并计算每个区域权值和每个样本的点积是否大于0；根据每个区域的权值和样本点积的情况计算每个区域的局部极小值；根据局部极小值的解的情况判断局部极小值的真实性，对于唯一的局部极小值可以直接判断是否与初始化定义区域内的任何点都在每个输入样本的同一侧，对于连续的解可以判断这个连续的解是否在它所定义的区间内，判定的方法是求半平面的交是否为空，对于半平面求交的问题可以转化成凸包问题方便求解。

主权项：1.一种单隐层ReLU神经网络局部极小值的求解方法，其特征在于：1、网络的构建：使用的网络是单隐层ReLU神经网络，具有K个具有ReLU激活的隐藏神经元，d个输入神经元和2个输出神经元，损失函数采用的是平方损失函数，所以这个单隐层ReLU神经网络的损失函数为：其中Lz,w为整个模型的损失函数,z＝{zk,k∈{1,2,3,…,K}},w＝{wk,k∈{1,2,3,…K}},[wj·xi]+＝max0,wj·xi为ReLU函数，zj为隐藏层到输出层之间的权值，j∈{1,2,3,…,K}，wi为输入层到隐藏层之间的权值,i∈{1,2,3,…,K}，N为输入样本个数，K为神经元个数,xi为第i个样本,yi为第i个样本的标签；2、权值空间区域划分：将权值空间划分为若干个凸的子单元，首先计算出每个子单元中Iij的值，Iij的值由wj·xi决定，若wj·xi＞0，Iij＝1否则Iij＝0，由于每个子单元都是凸的，在每个子单元中Iij的值都是恒定的，不会随着wj在本区域内的移动而改变，因此损失函数在每个子区域内是可微的；但是当wj从本区域移动到另一个相邻的区域内时，Iij的值将不再是恒定的；由于每个子单元都是凸的，所以损失函数在每个子单元内的局部极小值就是在这个子单元内的全局极小值；随机选取某个子单元内的wj的值用来计算Iij的值，这个值代表此子单元的Iij的值；3、局部极小值位置的计算：采用的损失函数是平方损失，令Rj＝zjwj，那么对神经网络的损失函数来说，各个区域内的局部极小值的解为：其中R*为损失函数在本区域的局部极小值解，Iij的值由wj·xi决定，若wj·xi＞0，Iij＝1否则Iij＝0，wj为输入层到隐层的第j个权值,Rj＝zj·wj，zj为隐层神经元到输出神经元之间的第j个权值，xi为第i个样本，yi为第i个样本的标签；其中重写为：AR＝y,其中该问题的一般解用A矩阵的Moore-Penrose逆表示： *＝A+y+I-A+Ac其中R*表示损失函数局部极小值的解，A+表示A矩阵的Moore-Penrose逆，c∈RKd是一个任意的向量,其中R为实数集合，K表示的是隐藏神经元的个数，d表示的是输入神经元的个数，I为单位矩阵，根据A矩阵的不同情况，解R*可能是唯一的也有可能是一段连续的无限个解，对于这两种情况在步骤4中都将给出验证是否为真实局部极小值的方法；4、局部极小值真实性的验证：由于ReLU激活函数的特性，导致第3步计算出来的局部极小值有可能不会落在初始化的子区域内，这种局部极小值是虚假的局部极小值，没有实际意义，因此需要验证步骤3所求得的局部极小值是否为真正的局部极小值，验证局部极小值是否真实的的关键就是要验证所求得的局部极小值是否在它初始化定义的区间内，对于唯一的局部极小值解来说，若解存在，则w*应该位于其初始化定义的区域内，其中w*为模型的输入层到隐层神经元的权值的解，即w*与它初始化定义区域内的任何点都在每个输入样本的同一侧，只需判断是否成立即可,其中i∈{1,2,3,…N},j∈{1,2,3,…,K}，为本区域的局部极小值第j个权值的解，xi为第i个样本，Iij的值由wj·xi决定，若wj·xi＞0，Iij＝1否则Iij＝0，对于R*是连续的情况，其中R*为损失函数局部极小值的解，需要判断这些连续的解是否在其定义划分区域内，将代入到上式中得到：其中第i个样本向量的转置，A+为A矩阵的Moore-Penrose逆矩阵，y为样本的标签，I为单位矩阵，c∈RKd是一个任意的向量；这个式子是关于c的一些半平面，若所有这些半平面的交集若为非空，则代表指定划分区域中的可微局部极小值存在；反之，如果所有半平面的交集若为空，则指定划分区域中的可微局部极小值不存在；5、使用凸包验证无限解的局部极小值的真实性：点集的上凸包与对偶平面中的直线集的下包络是完全相对应的，半平面求交集的问题对偶转换成凸包问题进行求解。

全文数据：

权利要求：

百度查询：北京工业大学一种单隐层ReLU神经网络局部极小值的求解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种园林绿化便携铲_马丽丽_202322375183.2

下一篇：一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

相关技术

一种园林绿化便携铲_马丽丽_202322375183.2

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种防卡管测斜仪探头_中国建筑西南勘察设计研究院有限公司_202420526288.5

局部相关技术

局部放电试验平台_广州粤能电力科技开发有限公司_202322638070.7

一种局部焊膏印刷重复定位装置_贵州航天电子科技有限公司_202322473621.9

使MRT系统的局部线圈失效的方法_西门子医疗有限公司_202311364118.8

一种金属件局部交变温度载荷模拟设备_上海海事大学_202410146040.0

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种局部时空图卷积交通流量预测方法及系统_北京工商大学_202211148650.1

渲染实体的局部信息拾取方法、装置、设备及存储介质_深圳市万翼数字技术有限公司_202310202850.9

一种实现金属件局部拉丝的自动化装置_上海五腾金属制品有限公司_201711440047.X

钢格构柱干湿循环局部腐蚀装置及其腐蚀速度测定方法_浙江东南网架股份有限公司_202210020889.4

基于生成随机数的局部最优截短伪随机序列的选码方法_中国人民解放军国防科技大学_202211259677.8

网络相关技术

用于标识通信网络中的网络节点的方法和通信网络_罗伯特·博世有限公司_201910574227.X

网络设备的升级_瑞典爱立信有限公司_201780096272.8

在区块链网络中验证交易的方法以及构成该网络的节点_比特飞翔区块链株式会社_201980026000.X

一种移动通信网络辅助广播网络的收发方法及其装置_上海交通大学_202210665237.6

基于多通道图卷积网络的社交网络节点分类方法与系统_扬州大学_202210353954.5

网络恢复方法、装置、设备及存储介质_北京华耀科技有限公司_202210476307.3

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

一种能带隙网络滤波器_南京志杰通信技术有限公司_202322522246.2

抵抗5G网络切片的侧信道攻击_微软技术许可有限责任公司_202280059705.3

一种网络数据存储服务器_南昌交通学院_202322497073.3

极小相关技术

基于不锈钢极小零件高精度双向钻孔加工技术_滨中元川金属制品(昆山)有限公司_202310637258.1

一种太极小夜灯_深圳市晶扬科技有限公司_202322194953.3

一种多功能极小曲面复合网格超结构及其制造方法_西安交通大学_202311841542.7

一种三周期极小曲面结构地质聚合物及其制备方法_西安交通大学_202211049610.1

基于场景信息解耦引导的极小物体检测方法及系统_安徽大学_202311188848.7

适用于极小接地孔接地的电磁波屏蔽膜、制备方法及应用_航天智造科技股份有限公司_202110904515.4

一种摄远比极小的长焦镜头_福建福光股份有限公司_202211002422.3

用钻孔做极小震-检距弹性波反射三维探查的方法及装置_北京水工资环新技术开发有限公司_201711366248.X

一种基于极小曲面的增材制造异型曲面换热器_北京理工大学_202311358957.9

一种基于网格划分的三周期极小曲面支撑结构的仿真及制造方法_闽都创新实验室_202211013882.6

龙图腾网&IPTOP

【发明授权】一种单隐层ReLU神经网络局部极小值的求解方法_北京工业大学_202110187212.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务