【发明授权】一种基于深度学习的DNA模体长度预测方法及预测系统_西安电子科技大学_202010552399.X

导航：龙图腾网> 最新专利技术> 一种基于深度学习的DNA模体长度预测方法及预测系统_西安电子科技大学_202010552399.X

申请/专利权人：西安电子科技大学

申请日：2020-06-17

公开（公告）日：2024-04-05

公开（公告）号：CN111933217B

主分类号：G16B30/00

分类号：G16B30/00;G16B40/00

优先权：

专利状态码：有效-授权

法律状态：2024.04.05#授权;2020.12.01#实质审查的生效;2020.11.13#公开

摘要：本发明属于DNA序列片断检测技术领域，公开了一种基于深度学习的DNA模体长度预测方法及预测系统，构建预测模体长度的机器学习模型，在包含模体的延伸矩阵中自动地学习模体的特征，进而可以智能地预测未知模体的长度。使用机器学习解决这一问题的条件已经具足。本发明利用已有数据可以构建充足的预测模体长度的训练样本。深度学习等机器学习模型近些年得到了快速的发展，并成功地应用于包含生物信息学在内的多种领域，利用深度学习可以更好地学习延伸矩阵中的模体特征并进行模体长度预测。本发明提出的模型在测试集上的预测准确率达到了90％以上，并且能够成功地优化现有模体发现算法找出的模体。

主权项：1.一种基于深度学习的DNA模体长度预测方法，其特征在于，所述基于深度学习的DNA模体长度预测方法包括：构建样本数据：在模体数据库中获取一个真实模体的PWM，使用PWM检测工具定位这个模体在DNA序列中的位点，对位点进行延伸，由对齐的延伸位点根据公式计算延伸矩阵Me，由Me根据公式计算相对熵向量V，将V作为样本并把这个模体的长度l作为标签；构建基于卷积神经网络的预测模体长度的深度学习模型；预测模型的应用：用改进的模体发现算法找出的模体按照构建样本数据的方法产生延伸矩阵Me和一个相对熵向量V，把V作为预测模型的输入；根据预测模型得出模体长度l得到优化的模体；构建基于卷积神经网络的预测模体长度的深度学习模型的方法包括：用卷积层conv、池化层pool和全链接层net组成CNN；CNN为每个基色建立一个通道，使用卷积核对不同的通道分别进行卷积，最终把卷积后的结果进行融合；预测模体长度的样本是相对熵向量，将样本作为一维图像，且每个像素值由一个基色分量组成；将长为L的相对熵向量复制两份拓展成3×L的矩阵，记为Minput，作为模型的输入；CNN模型fMinput表示如下：fMinput＝netpoolconvMinput；第一层是卷积层为一个特征扫描器，在矩阵Minput中提取隐含的高相对熵片断的特征；将卷积核的长度设置为24；卷积核为3×24的矩阵；设置128个卷积核，并进行随机初始化；在训练中，更新的参数是128个3×24的卷积核和128个3×24的偏执项；将扫描输入矩阵Minput的步长设置为1；输出是一个40×128的张量，其中40是Minput的长度，128是卷积核的个数；第二层是池化层，用于保留主要特征；这输入是卷积层输出的40×128的张量通过激活函数ReLU处理后的结果；采用最大池化进行采样，并将池化窗口大小设置为4；池化的输出是一个10×128的张量；ReLUx＝max{0,x}；第三层是神经网络，输入层是池化层输出的10×128的张量转化成的向量；通过一个隐藏层将这个向量与输出层作映射；将隐藏层中神经元的个数设置为256；从输入层到隐藏层间的参数为10×128×256个权值和相同个数的偏执项；输出层包含14个神经元，对应于14种模体长度；从隐藏层到输出层间的参数是256×14个权值和相同个数的偏执项；在隐藏层和输出层间执行Dropout操作，在训练时随机的丢弃一些隐藏层的神经元，防止模型过拟合；使用Softmax函数作为激活函数，将输出层中各神经元的数值zi1≤i≤14映射到[0,1]区间内：使用交叉熵函数作为模型的损失函数；假设模型对于某个标签为y的样本的预测输出为y',样本的loss值；使用Adam算法降低损失函数值并以此来优化模型；预测模型应用方法包括：第一步，在构建预测样本时，直接由Mmotif定位位点并将Mmotif置于延伸位点的正中心，生成一个延伸矩阵Me，然后得到一个相对熵向量V作为预测样本；将V输入给预测模型得到模体长度；第二步，根据预测模型预测出的模体长度l优化现有模体发现算法找出的模体Mmotif；第三步，预测模型用于加速现有模体发现算法。

全文数据：

权利要求：

百度查询：西安电子科技大学一种基于深度学习的DNA模体长度预测方法及预测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于Flink流处理的地铁轨道几何检测数据清洗方法_成都国铁电气设备有限公司_202210023454.5

下一篇：一种沉香GC-MS指纹图谱的构建方法_莆田海关综合技术服务中心_202111293274.0

相关技术

一种基于Flink流处理的地铁轨道几何检测数据清洗方法_成都国铁电气设备有限公司_202210023454.5

一种沉香GC-MS指纹图谱的构建方法_莆田海关综合技术服务中心_202111293274.0

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种即时检验抗凝药物监测系统_北京倍肯恒业科技发展股份有限公司_202310581047.0

一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

一种焊枪铜线的自动夹扣装置_温州技师学院_201910988267.9

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

用于控制空调的方法及装置、空调_青岛海尔空调电子有限公司_202210048335.5

一种用于开槽埋管的冷冻施工辅助设备及方法_长江生态环保集团有限公司_202310118173.2

长度相关技术

一种锚链长度测量装置_兴化市通舟船舶设备有限公司_202410412908.7

一种针尖长度可调式射频消融电极_苏州腾之瑞医疗科技有限公司_202410307413.8

一种长度可调节的电动病床_宁波禾采医疗器械有限公司_202322685359.4

用于采用印迹长度自动定位轮胎的系统_固特异轮胎和橡胶公司_202311487493.1

纤维长度的近红外光谱测定方法_江西省林业科学院_202410190498.6

一种可调节长度的联轴器_天津仁创精密机械有限公司_202322667177.4

一种对拉螺杆长度调节装置_陕西建工第一建设集团有限公司_202322646203.5

一种便于调节长度的乙醇取样装置_河北诺瑞康医药科技有限公司_202322911464.5

一种适应不同长度模具钢的夹持装置_浙江鑫哲模具有限公司_202322533303.7

一种用于控制SN锚杆外露长度的限位装置_中电建十一局工程有限公司_202322530269.8

模相关技术

穿头模机构_佛山市舜鑫机械设备科技有限公司_202322584441.8

迭模、迭模的用途、压缩装置和连续系统_伊沃克拉尔维瓦登特股份公司_202311481924.3

一种基于多模光纤的锁模光纤激光器_深圳大学_202410054580.6

后浇带支模体系、楼板支模体系以及施工方法_中国十九冶集团有限公司_202410335100.3

一种方便装模与取模的精密模具_众鸣精密工业(深圳)有限公司_202322967405.X

一种爬模装置_张红_202322760682.3

防止挤压变形的刀模_东莞市硅翔绝缘材料有限公司_202322669335.X

模铸钢锭吸灰管_武汉重工铸锻有限责任公司_202322573983.5

一种土建翻模工艺_杭州美屋美居数智科技有限公司_202410293983.6

一种模腔清理结构_合肥万卓精密科技有限责任公司_202321880066.5

体相关技术

锁体_广东欧朗安防科技有限公司_202322218273.0

移动体控制装置、移动体以及移动体控制方法_本田技研工业株式会社_202110280817.9

粉体输送系统_广东邦普循环科技有限公司_202322366656.2

智能锁体_广东欧朗安防科技有限公司_202322218372.9

SiC膜构造体_艾德麦普株式会社_201980001810.X

粉体装料设备_广东邦普循环科技有限公司_202210749077.3

新型圆筒筛体_江苏财经职业技术学院_202010166041.3

电极结构体_丰田自动车株式会社_202311454930.X

充填有缓震粒体的避震囊体和结合该避震囊体的座垫_英属开曼群岛商锋明国际股份有限公司台湾分公司_202322314036.4

适体‐siRNA融合体_艾普特纳有限公司_202410263273.9

龙图腾网&IPTOP

【发明授权】一种基于深度学习的DNA模体长度预测方法及预测系统_西安电子科技大学_202010552399.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务