【发明授权】使用基因组描述符紧凑表示生物信息学数据的方法和设备_耶诺姆希斯股份公司_201880012026.4

申请/专利权人：耶诺姆希斯股份公司

申请日：2018-02-14

公开（公告）日：2024-03-15

公开（公告）号：CN110663022B

主分类号：G06F7/00

分类号：G06F7/00

优先权：["20170214 US PCT/US2017/017842","20170711 US PCT/US2017/041591"]

专利状态码：有效-授权

法律状态：2024.03.15#授权;2020.02.04#实质审查的生效;2020.01.07#公开

摘要：用于压缩由基因组测序机器所产生的基因组序列数据的方法和设备。通过将序列读段相对于预先存在或构建的参考序列进行比对来编码序列读段，编码处理包括将读段分类为数据类别，然后根据多个描述符块对每个类别进行编码。特定的源模型和熵编码器用于划分数据的每个数据类别，以及每个相关联的描述符块。

主权项：1.一种用于编码基因组序列数据的计算机实施的方法，其特征在于，所述基因组序列数据包括核苷酸序列的读段，所述方法包括以下步骤：将所述读段与一个或多个第一参考序列进行比对，从而创建比对的读段，根据具有所述一个或多个第一参考序列的指定匹配规则将所述比对的读段分类成不同的类别，从而创建比对的读段的类别，所述分类包括：当相对于用于映射的所述参考序列在映射的读段中不存在错配时，将所述参考序列中没有任何错配的基因组读段识别为第一类别,P类；当仅在测序机器不能调用任何“碱基”的位置发现错配，并且每个读段中的所述错配的数量不超过给定阈值时，将基因组读段识别为第二类别,N类；当在所述测序机器不能调用任何“碱基”，被称为“n型”错配，和或调用与所述参考序列不同的“碱基”，被称为“s型”错配，的位置发现错配，并且所述错配的数量不超过所述“n型”、“s型”错配数量的给定阈值和从给定函数,fn，s获得的阈值时，将基因组读段识别为第三类别,M类；当基因组读段可能具有相同类型的所述第三类别,M类错配，以及另外以下类型的至少一个错配：插入,i型、删除,d型、软剪切或硬剪切,c型，并且其中，所述每个类型的错配的数量不超过相对应的给定阈值和由给定函数,wn，s，i，d，c提供的阈值时，将基因组读段识别为第四类别,I类；将所述分类的比对的读段编码为用于相应类别且在相应类别内同质的多个描述符块，其中，将所述分类的比对的读段编码为多个描述符块包括，根据所述比对的读段的类别选择所述描述符，用报头信息来构建所述描述符块，从而创建连续的访问单元；其中，使用用于关于映射位置的信息的描述符块、用于关于链特异性，即，所述读段序列来自的DNA链的信息的描述符块以及用于关于序列读段的特征的信息的“flags”来构建所述第一类别,P类访问单元；并且其中，在所述P类访问单元中，使用相应描述符块来编码配对端读段的配对信息；其中，使用所述第一类别,P类访问单元的相同描述符块加上用于关于未知碱基的所述位置的所述信息的描述符块来构建所述第二类别,N类访问单元；其中，使用所述第一类别,P类访问单元的相同描述符块加上用于关于替换的位置和类型的信息的描述符块来构建所述第三类别,M类访问单元；其中，使用所述第一类别,P类访问单元的相同描述符块加上用于关于替换、插入、删除和剪切的碱基的位置和类型的信息的描述符块来构建所述第四类别,I类访问单元；所述方法还包括：将在所述第一至所述第四类别,P、N、M、I类中没有找到任何分类的基因组读段识别为第五类别,U类，使用至少一些所述第五类别的所述读段来构建一组第二参考序列，将所述第五类别的所述读段与所述一组第二参考序列进行比对，基于相对于所述第二参考序列的指定的匹配精确性约束，将所述第五类别的所述读段编码为相应描述符，用报头信息来构建所述相应描述符，从而创建第五类别的访问单元。

全文数据：

权利要求：

百度查询：耶诺姆希斯股份公司使用基因组描述符紧凑表示生物信息学数据的方法和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

下一篇：4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

相关技术

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

表示相关技术

生成参数化空间音频表示_诺基亚技术有限公司_202311364503.2

一种读取矩形电表示数的方法_南通锡鼎智能科技有限公司_202211292251.2

使用光度网格表示的3D对象重建_奥多比公司_202010071801.2

基于中间表示模型的UXUI高效协作的低代码方法_宁波沃尔斯软件有限公司_202410144121.7

用于编码网格表示的连接性信息编码方法和装置_创峰科技_202280059392.1

用于编码网格表示的连接性信息编码方法和装置_创峰科技_202280059328.3

基于重构过完备表示的稀疏信号配电网故障定位方法_华南理工大学_202210735654.3

用于编码网格表示的连接性信息编码方法和装置_创峰科技_202280059393.6

基于三平面特征表示和视角条件扩散模型的结构智能三维重构方法_哈尔滨工业大学_202410162330.4

一种具备抵制过度平滑能力的自监督异质图表示学习方法_哈尔滨工业大学(威海)_202311451594.3

紧凑相关技术

一种紧凑型涡轮盘法兰式连接装置_苏州市德格恩机电有限公司_202322778902.5

带高紧凑联动脱扣组件的互锁式塑壳断路器_杭州程翔电气有限公司_202322618554.5

一种组合式变电站紧凑模块化低压仓_深圳市华诚电力设备有限公司_202321847425.7

现场设备和用于电子电路的电子组件的紧凑布置的方法_VEGA格里沙贝两合公司_202311367155.4

用于紧凑型平视显示器的全息图计算_恩维世科斯有限公司_202311285242.5

一种紧凑型MBR污水处理装置_浙江开创环保科技股份有限公司_202322164014.4

一种用于料床粉磨系统的紧凑型组合式选粉机_天津水泥工业设计研究院有限公司_201811043776.6

一种紧凑型百kW-MW级SOFC冷热电系统及其运行方法_中国华电科工集团有限公司_201911071931.X

紧凑型空气处理机组_绿特国创(潍坊)节能科技有限公司_202322371334.7

一种紧凑型电动缸_常州鑫鼎机电设备有限公司_202322056806.X

生物信息学相关技术

信息处理系统、信息处理方法以及信息处理装置_丰田自动车株式会社_202311325525.8

一种基于多生物识别信息的银行业务助理机器人_山东大学_201710304848.7

信息发送、信息接收方法及装置_华为技术有限公司_201910169504.9

信息处理装置、信息处理方法以及程序_索尼公司_201880080945.5

信息处理装置_丰田自动车株式会社_202311341895.0

信息处理方法_丰田自动车株式会社_202311358127.6

信息处理装置_丰田自动车株式会社_202311354956.7

信息处理装置_丰田自动车株式会社_202311246991.7

使用双作用运动学安装件进行材料传递的技术_康宁股份有限公司_202311356752.7

生物检测用取样管_辽宁千一测试评价科技发展有限公司_202322243817.9

龙图腾网&IPTOP

【发明授权】使用基因组描述符紧凑表示生物信息学数据的方法和设备_耶诺姆希斯股份公司_201880012026.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务