买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于深度图像特征和阈值学习策略的蛋白质亚细胞定位的方法_天津大学_202011148528.5 

申请/专利权人:天津大学

申请日:2020-10-23

公开(公告)日:2021-01-08

公开(公告)号:CN112201300A

主分类号:G16B15/20(20190101)

分类号:G16B15/20(20190101);G06N3/04(20060101)

优先权:

专利状态码:有效-授权

法律状态:2022.05.13#授权;2021.01.26#实质审查的生效;2021.01.08#公开

摘要:本发明公开了一种基于深度图像特征和阈值学习策略的蛋白质亚细胞定位的方法,包括以下步骤:步骤1,数据收集和数据预处理;步骤2,数据增强训练集测试集划分;步骤3,构建基于卷积神经网络的特征提取器;步骤4,利用最小冗余最大相关算法结合后向特征消除进行特征提取;步骤5,构建亚细胞定位分类器;步骤6,性能评价,步骤7,利用单标签亚细胞定位预测器蛋白质免疫组化单标签图像进行预测,利用多标签亚细胞定位预测器对蛋白质免疫组化多标签图像进行预测。本发明引入了阈值学习策略,可以更好的挖掘标签与样本以及标签与标签之间的相关性使得多标签蛋白质亚结构的定位预测性能更好。

主权项:1.一种基于深度图像特征和阈值学习策略的蛋白质亚细胞定位的方法,其特征在于,包括以下步骤:步骤1,数据收集和数据预处理:1-1,准备数据集:所述数据集包括蛋白质免疫组化单标签图像I1;蛋白质免疫组化多标签图像I2;1-2,将步骤1-1中所述的蛋白质免疫组化单标签图像I1进行线性光谱分离得到所述的蛋白质免疫组化蛋白质通道单标签图像P1;将步骤1-1中所述的蛋白质免疫组化多标签图像I2进行线性光谱分离得到所述的蛋白质免疫组化蛋白质通道多标签图像P2;步骤2,数据增强和训练集、测试集划分:2-1对步骤1-2中所得的蛋白质免疫组化蛋白质通道单标签图像P1进行上下翻转、左右翻转和旋转得到扩充后的数据集P_Aug1;2-2对步骤1-2中所得的蛋白质免疫组化蛋白质通道多标签图像P2进行上下翻转、左右翻转和旋转得到扩充后的数据集P_Aug2;2-3对步骤2-1中所得的数据集P_Aug1进行划分得到训练集Train1和测试集Test1;2-4对步骤2-2中所得的数据集P_Aug2进行划分得到训练集Train2和测试集Test2;步骤3,构建基于卷积神经网络的特征提取器:3-1构建基于卷积神经网络的单标签数据集特征提取器:构建五个卷积神经网络作为蛋白质免疫组化蛋白质通道单标签图像的特征提取器,即AlexNet,VggNet,ResNet、DenseNet和XceptionNet,将训练集Train1和测试集Test1放入五个不同的神经网络中进行训练和测试,图像的尺寸和放入的神经网络的输入尺寸相符,当训练和测试结束,将蛋白质免疫组化蛋白质通道单标签图像P1的尺寸分别调整成符合五个卷积神经网络输入的大小然后进行图像特征的提取,最终由五种卷积神经网络提取器得到了五组不同的特征;3-2构建基于卷积神经网络的多标签数据集特征提取器:构建五个卷积神经网络作为蛋白质免疫组化蛋白质通道多标签图像的特征提取器,即AlexNet,VggNet,ResNet、DenseNet和XceptionNet,将训练集Train2和测试集Test2放入五个不同的神经网络中进行训练和测试,图像的尺寸和放入的神经网络的输入尺寸相符,当训练结束,将蛋白质免疫组化蛋白质通道多标签图像P2的尺寸分别调整成符合五个网络输入的大小然后进行图像特征的提取,最终由五种卷积神经网络提取器得到了五组不同的特征;步骤4,利用最小冗余最大相关算法结合后向特征消除进行特征提取:使用最小冗余最大相关算法结合后向特征消除来减少特征冗余,分别对蛋白质免疫组化蛋白质通道单标签图像P1的五组特征和蛋白质免疫组化蛋白质通道多标签图像P2的五组特征进行特征选择,分别生成P1的最佳特征子集和P2的最佳特征子集;步骤5,构建亚细胞定位预测器:5-1构建单标签亚细胞定位预测器:利用步骤4中确定的P1的最佳特征子集,使用支持向量机进行分类;5-2构建多标签亚细胞定位预测器:将图像的标签集表示为L={l1,l2,...l9},如果li属于此图像,则将值设为1,否则为0,将步骤4中确定的P2的最佳特征子集放入支持向量机进行训练,对于每个图像支持向量机都输出九个分数S={s1,s2,...,s9},分别代表每个类别的概率;首先将具有最大概率smax的标签分配给样本,即将L中与smax位置相对应的位置设置1,然后寻找与smax相近的概率值,首先设置一个阈值θ,将与smax差值小于θ的第i个标签分配给图像,li值的确定过程如下: 其中,li为图像第i个位置的标签值,值为1表示该标签属于图像,值为0表示该标签不属于图像,i=1、2、3......9;si为图像第i个位置的概率值,i=1、2、3......9;smax为9个概率中最大的概率,Sdif={sdif1,sdif2,...,sdif9}为概率差向量,sdifi表示第i个位置的概率与smax的差值,i=1、2、3......9;步骤6,亚细胞定位预测器的性能评价:6-1选定单标签性能评价指标,对单标签亚细胞定位预测器的性能进行评价;6-2选定多标签性能评价指标,对多标签亚细胞定位预测器的性能进行评价;步骤7,利用单标签亚细胞定位预测器蛋白质免疫组化单标签图像进行预测,利用多标签亚细胞定位预测器对蛋白质免疫组化多标签图像进行预测。

全文数据:

权利要求:

百度查询: 天津大学 基于深度图像特征和阈值学习策略的蛋白质亚细胞定位的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。