【发明授权】一种用于预测蛋白质功能的数据多标签分类方法_昆明理工大学_202010984625.1

导航：龙图腾网> 最新专利技术> 一种用于预测蛋白质功能的数据多标签分类方法_昆明理工大学_202010984625.1

申请/专利权人：昆明理工大学

申请日：2020-09-18

公开（公告）日：2024-04-09

公开（公告）号：CN112365931B

主分类号：G16B40/20

分类号：G16B40/20;G16B5/00

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2021.03.05#实质审查的生效;2021.02.12#公开

摘要：本发明涉及一种用于预测蛋白质功能的数据多标签分类方法，属于生物信息学及数据挖掘技术领域。本发明包括步骤：把蛋白质序列生物数据由字符转换成向量的形式，对高维的向量形式进行降维处理；构建用于进行蛋白质序列生物数据标签分类模型，具体的，采用二元分类器蛋白质序列生物数据进行标签分类；利用构建好的标签分类模型进行预测标签分类。本发明能够高效解决蛋白质标签缺失情况下的功能的预测问题，同时本方法可操作性强，实用性强，不仅在基本蛋白质功能预测问题上表现出了良好性能，也在其他蛋白质功能预测上表现出了良好的性能。

主权项：1.一种用于预测蛋白质功能的数据多标签分类方法，其特征在于，所述方法包括：Step1、把蛋白质序列生物数据由字符转换成向量的形式，对高维的向量形式进行降维处理；Step2、构建用于进行蛋白质序列生物数据标签分类模型，具体的，采用二元分类器蛋白质序列生物数据进行标签分类；Step3、利用构建好的标签分类模型进行预测标签分类；所述步骤Step1包括：Step1.1、蛋白质序列生物数据用向量X表示，X＝[x1,x2,…xn]T∈Rn×m，也用作蛋白质预测模型训练数据，并且训练数据对应的蛋白质标签被表示为Y＝[y1,y2,…,yn]T∈{0,1}n×l，yi,j＝1表示第i个蛋白质具有第j个标签yj，yi,j＝0表示第i个蛋白质没有标签yj或者该值未被观测到，即丢失，对任意非零的矩阵W，其中wi和wj分别代表第i行和第j列，wi,j是矩阵中第i,j个元素；Step1.2、从蛋白质序列生物数据的向量形式中提取出来最具辨识度的低维特征，用于得到一个简洁且有效的特征子空间；所述Step2中，构建用于进行蛋白质序列生物数据标签分类模型，具体的，采用二元分类器蛋白质序列生物数据进行标签分类，此二元分类器的目标函数的优化采用如下方式进行：Step2.1、假设每个标签仅由来自给定蛋白质数据集的原始特征集的子集确定，为了防止预测蛋白质功能的多标签分类方法过拟合，将线性模型进行l1范数正则化；这些标签的功能由每个非零条目确定，即wi∈Rn,并且对相应的标签具有很强的可辨性，二元分类器的目标函数表示为: 将所有二元分类器组合在一起，目标函数写成如下：其中任意非零的矩阵W＝[w1,w2,…,wl]∈Rn×l是回归系数，λ3≥0是折中的参数；Step2.2、利用标签相关性在目标函数中加入标签相关矩阵、l1范数正则项来优化目标函数表达式；C∈Rl×l作为标签相关矩阵，Ci,j表示标签yi与yj的相关程度，在C的基础上添加l1范数正则项来学习稀疏标签依赖，目标函数写成如下所示： s.t.C≥0Step2.3、如果标签yi和标签yj强相关，则它们具有类似的标签特定特征，相应的模型系数wi和wj将非常相似，并且它们之间的欧几里德距离很小，否则wi和wj将不同，并且它们之间的欧几里德距离很大，经过数学运算后，目标函数表达式能优化成如下所示： s.t.C≥0其中，λ1、λ2、λ3、λ4是折中的参数；X为蛋白质序列生物数据的向量表示，Y为蛋白质标签表示，对任意非零的矩阵W，其中wi和wj分别代表第i行和第j列；Step2.4、利用最终优化后的目标函数表达式利用加速近端梯度法求解参数任意非零的矩阵W和标签相关矩阵C，求解出参数W、C之后，从而得到最终的目标函数。

全文数据：

权利要求：

百度查询：昆明理工大学一种用于预测蛋白质功能的数据多标签分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

下一篇：一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

相关技术

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

数据相关技术

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

多接入数据连接上的数据分组引导_联想(新加坡)私人有限公司_201880092121.X

数据存储方法及装置_恒生电子股份有限公司_202311433168.7

数据标注方法及装置_深圳市优必选科技股份有限公司_202010604308.2

数据存储方法、数据读取方法、电子设备和存储介质_北京壁仞科技开发有限公司_202410218124.0

产品全生命周期评价的数据收集方法及数据收集系统_北京中创绿发科技有限责任公司_202110549695.9

融合试题数据和解答数据的多知识点标注方法和系统_华中师范大学_202011282980.0

一种数据关系捕获及大数据关系树构建方法_中通服创立信息科技有限责任公司_202111142241.6

高并发性数据迁移方法及数据安全存储装置_北京中领启天信息科技有限公司_202311552020.5

一种基于大数据的农业数据分析管理系统及方法_上海华维可控农业科技集团股份有限公司_202310584420.8

功能相关技术

多功能拔罐_广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院)_202110781938.1

功能开关组_浙江亚伯兰电器有限公司_202322499094.9

多功能座椅_永艺家具股份有限公司_201810149901.5

多功能帐篷_上海云层文化发展有限公司_202321975013.1

多功能美工刀_李汤米_202322438541.X

全自动多功能烫画机_缙云县盛达缝制设备有限公司_202322206454.1

多功能键盘刷_陈伟望_202322655819.9

一种具有清洁功能的多功能复合机_苏州圆周率纺织整理有限公司_202322189951.5

一种多功能面料_广东省安华智纺纺织科技有限公司_202322157475.9

具有封堵功能的单向阀_扬州华光新材料股份有限公司_202322539895.3

标签相关技术

一种塑料标签_南通星焰智能科技有限公司_202322574742.2

标签识别网络的训练方法、标签识别装置/方法及设备_京东方科技集团股份有限公司_201811353105.X

一种手写标签纸_张必余_202322626909.5

一种表面不平整标签_浙江酷勒包装材料有限公司_202322612648.1

一种标签印刷智能配墨装置_广州广彩标签有限公司_202322515675.7

识别标签的方法、装置、设备以及介质_北京有竹居网络技术有限公司_202011086888.7

一种电子标签的封装结构_苏州鑫福耀智能科技有限公司_202322712016.2

一种基于动态标签的NFC充电装置_浙江先芯科技有限公司_202321917628.9

一种便于清洁的电子标签_苏州鑫福耀智能科技有限公司_202322479066.0

具有3球式离合器和旋转驱动脱扣器的安全标签_先讯美资电子有限责任公司_202080053308.6

龙图腾网&IPTOP

【发明授权】一种用于预测蛋白质功能的数据多标签分类方法_昆明理工大学_202010984625.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务