买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】保持密码子偏好性的DNA蛋白质编码区域流式数据存储方法_基诺创物(武汉市)科技有限公司_202311060090.9 

申请/专利权人:基诺创物(武汉市)科技有限公司

申请日:2023-08-21

公开(公告)日:2024-03-19

公开(公告)号:CN117095752B

主分类号:G16B35/00

分类号:G16B35/00;G16B20/00

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2023.12.08#实质审查的生效;2023.11.21#公开

摘要:本发明公开了一种保持密码子偏好性的DNA蛋白质编码区域流式数据存储方法,本发明中借鉴了熵编码和算术编码方法,使用密码编码学技术拟合输出符号的概率分布,并使用重整化技术将编码、解码均构造为流式算法。本发明可以突破已有技术手段在考虑密码子偏好性、信息空间利用率低、计算复杂度高等方面的不足,能够在编码结果符合密码子偏好性、高效计算的同时充分利用DNA蛋白质编码区域的信息空间。

主权项:1.一种保持密码子偏好性的DNA蛋白质编码区域流式数据存储方法,包括编码方法;其特征在于,具体包括以下步骤:步骤A1:针对输入定进制数据流[u0,u1,...,uZ-1],其进制数为b≥2,长度为Z,Z≥2,0≤uj≤b-1,0≤j≤Z-1;确定用于存储的氨基酸序列,其长度为W,W≥1,确定正整数参数B;步骤A2:根据确定的氨基酸序列,确定各氨基酸分别对应密码子的期望密码子偏好性其中,Ki表示第i个位置上的可选符号数量,Di中的各个元素表达了这一位置上各个符号的期望出现概率之比;0≤k≤Ki-1;步骤A3:赋值i:=0,j:=0,N:=0;N表示内部预设变量;步骤A4:判断iW是否成立;若是,则从步骤A5开始执行;若否,则从步骤A8开始执行;步骤A5:判断jZ且NB是否成立;若是,则从步骤A6开始执行;若否,则从步骤A7开始执行;步骤A6:赋值N:=N*b+uj,赋值j:=j+1;并回转执行步骤A4;步骤A7:计算N,ri:=Int2BMRN,Di,赋值i:=i+1,其中ri为第i个氨基酸选定的密码子;并回转执行步骤A4;所述计算N,ri:=Int2BMRN,Di,具体实现包括以下子步骤:步骤A7.1:对于输入计算步骤A7.2:计算具体实现包括以下子步骤:步骤A7.2.1:对于输入令满足0≤j≤Ki-1的每个整数值j对应di,j个坐标点j,0,j,1,...,j,di,j-1,得到个坐标点;步骤A7.2.2:将这些坐标点进行重新排序得到步骤A7.2.3:返回作为结果;步骤A7.3:对于输入N,赋值nr:=NmodLi,步骤A7.4:赋值步骤A7.5:赋值N′:=nq*di,r+q;赋值ri为第i个氨基酸对应的第r种密码子;步骤A7.6:返回N′,ri作为结果,并赋值给N,ri;步骤A8:判断N0是否成立;若是,则赋值Result:=None;若否,则赋值Result:=rW-1...r1r0;步骤A9:输出Result作为编码结果。

全文数据:

权利要求:

百度查询: 基诺创物(武汉市)科技有限公司 保持密码子偏好性的DNA蛋白质编码区域流式数据存储方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。