首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种联合显微图像和RNA的空间组学数据压缩和传输方法_西安电子科技大学;深圳华大生命科学研究院_202211738919.1 

申请/专利权人:西安电子科技大学;深圳华大生命科学研究院

申请日:2022-12-31

公开(公告)日:2024-05-17

公开(公告)号:CN116033033B

主分类号:H04L69/04

分类号:H04L69/04;H04L67/1074

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2023.05.16#实质审查的生效;2023.04.28#公开

摘要:本发明公开了一种联合显微图像和RNA的空间组学数据压缩和传输方法,包括以下步骤;步骤1:对显微图像进行分割,得出有效蒙版图像和有效RNA序列;步骤2:使用图像中的颜色对RNA序列进行聚类;步骤3:对RNA序列和显微图像进行压缩,得到需要传输的数据;步骤4:对需要传输的数据进行分块和多层摘要计算;步骤5:通过自适应通道进行网络数据传输。本发明具有数据压缩率高,传输过程稳定可靠的特点,能够达到减小存储和高效传输的目的。

主权项:1.一种联合显微图像和RNA的空间组学数据压缩和传输方法,其特征在于,包括以下步骤;步骤1:对显微图像进行分割,得出有效蒙版图像和有效RNA序列;步骤2:使用图像中的颜色对RNA序列进行聚类;步骤3:对RNA序列和显微图像进行压缩,得到需要传输的数据;步骤4:对需要传输的数据进行分块和多层摘要计算;步骤5:通过自适应通道进行网络数据传输;所述步骤1具体为:1对显微图像进行灰度化处理;输入显微图像I1,并对于显微图像采用加权平均法的灰度化的预处理后得到灰度图像I2,对于显微图像中的每个像素点的三个通道的值相同,并用统一的灰度值替代,将三个通道的通道值进行加权,实际中使用的公式为:I2x,y=wrRx,y+wgGx,y+wbBx,y其中Rx,y为红色像素点,Gx,y为绿色像素点,Bx,y为蓝色像素点,对应的wr为红色像素点所占权重,wg为绿色像素点所占权重,wb为蓝色像素点所占权重;2对灰度图像I2采用OTSU分割算法进行前后景的分离,得到蒙版图像I4;使用OTSU算法对I2灰度图像处理得到方差最大的灰度阈值作为L,L为图像中亮度方差最大的灰度值,对于灰度值小于L的像素点作为背景图像I3,对于灰度值大于等于L的像素点作为目标蒙版图像I4,对蒙版图像I4的冗余性考虑,使用优化后的阈值L2,所述L2=L+5,用于分离生物组织的前后景;3对蒙版图像I4进行开闭运算和膨胀操作;在生物组织切片的过程中,生物组织会产生细小的组织结构,造成微小结构无法采集有效的图像,同时在组织染色过程中会出现染色不均匀的情况,会造成一部分生物组织没有被染色从而被当作背景图像I3,在使用阈值分割算法的时候,会产生一些毛刺和很小的空隙K在目标蒙版图像I4中,为保证在阈值分割中的目标蒙版图像I4能够完整的覆盖所有的生物切片组织,对图像进行闭运算得到闭运算蒙版图像I5=[I4⊕-Kernal]Θ-Kernal,其中Kernal为全1的5*5的矩阵,闭运算填平像素中的毛刺和很小的空袭K而其他像素的位置和形状不变,对于闭运算蒙版图像I5的内部已经充分的覆盖生物组织,对于整个组织的边界考虑空间冗余性,对闭运算蒙版图像I5经过膨胀操作产生蒙版图像I6=I5⊕Kernal,其中Kernal为全1的5*5的矩阵,对蒙版图像的像素点进行进一步的外扩,保证所有的边缘微结构都可以包含在蒙版图像I6中;4对RNA序列按照蒙版图像I6进行过滤输入空间组学RNA序列S1,S1中每条数据都包含I6图像中的对应坐标X和Y,筛选整个S1数据并将蒙版外对应的数据删除留下有效数据S2;所述RNA序列中包含很多read,其中read为组成RNA的最小序列,在一段read中包含采集时的X,Y坐标信息,对应显微图像I1中像素点坐标的X,Y,由于在上述步骤中没有发生图像大小变换,因此蒙版图像I6和显微图像I1的X,Y坐标相互对应,蒙版图像I6中值为1的像素点所对应read序列集合即为有效RNA序列S2,S2={read|read∈S1^read.x,read.y∈I6}其中read为输入RNA序列S1的最小序列;所述步骤4具体为:对需要传输的数据D12中的每个文件的数据进行分块,每个块的大小为固定比特,使用MD5算法计算每个小块的摘要Mi=MD5Nodei,Node∈D12,0≤i≤m,其中Node为D12分成的m个的固定小块,MD5为摘要函数,在计算完所有的MD5值Mi后计算一个总的MD5值Ms=MD5∑Mi;空间组学数据需要多次发送给不同的客户端,在首次数据传输中对摘要信息进行计算,以后的摘要信息只需要进行读取;在文件传输过程中,需要传输每个块和其对应的校验值,客户端接收到后进行实时计算,如果出现校验不通过则向客户端重新请求改数据,客户端在接收完需要传输的数据D12后,对接收到的校验值计算总的校验值Mc,如果出现Mc不等于Ms的情况则客户端重新向服务端请求所有的分块信息列表,并找出错误块进行重新传输和计算直到Mc等于Ms,在文件解码过程中,对生物信息中的数据进行校验;所述步骤5具体为:将数据D12从服务端发送到客户端,在服务端和客户端之间的网络被称为目标网络,在发送数据D12之前先对目标网络的性能进行测试,使用ping工具和iperf工具对目标网络中的延迟和丢包率进行测量,测试时间为30秒得出延迟序列D和丢包率Lr,并计算序列D的最大值Dmax=maxD、最小值Dmin=minD和平均值通过以上参数对网络传输的通道进行选择,当Davg100ms且Dmax–Dmin20ms且Lr10%则使用KCPTUN通道进行数据的传输,否则使用TCP通道进行数据传输,在传输的过程中每10分钟进行网络质量的重新测试,在新传输的小块中采用新选择的通道;在客户端接收到数据后对每个小块进行摘要计算并和服务端发送的摘要值进行对比,同时对数据中的位置坐标进行有效性检测,如果其中有无法通过的检测,则向服务端重新发送请求,对数据进行重发。

全文数据:

权利要求:

百度查询: 西安电子科技大学;深圳华大生命科学研究院 一种联合显微图像和RNA的空间组学数据压缩和传输方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术