买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于TabNet-GRA的食品安全风险预测方法与可视分析系统_北京工商大学_202310904267.2 

申请/专利权人:北京工商大学

申请日:2023-07-21

公开(公告)日:2023-10-24

公开(公告)号:CN116933928A

主分类号:G06Q10/04

分类号:G06Q10/04;G06Q10/0635;G06Q50/26

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.11.10#实质审查的生效;2023.10.24#公开

摘要:本发明公布了一种基于TabNet‑GRA的食品安全风险预测方法与可视分析系统。预测方法包括:风险指标选择与抽检数据预处理;基于GRA的食品中多风险指标关联融合与综合风险值计算;基于TabNet的食品安全风险预测模型构建和训练优化。该方法克服了传统食品风险预测方法主观性强、计算复杂、未考虑食品污染规律的问题,可快速预测食品风险。可视分析系统包括控制面板模块、风险预测结果视图、污染物检出含量视图、各样本中风险组成视图、各样本详细信息视图、风险值分布视图、风险分析报告生成模块,可实现对抽检数据的多维度交互式可视分析、风险预测和报告生成,提高了食品安全风险分析的效率和维度,可帮助食品监管部门制定针对性的抽检、监管方案,提高监管效率。

主权项:1.一种基于TabNet-GRA的食品安全风险预测方法,其特征是,风险指标选择与抽检数据预处理;食品中多风险指标关联融合和综合风险值计算;食品安全风险预测模型的构建和训练优化;利用训练好的模型对新的待测抽检数据进行风险预测;包括如下步骤:A.风险指标选择与抽检数据预处理得到有效的抽检数据集;根据食品类别选择会导致该类食品风险的主要污染物作为风险指标;同时对原始抽检数据进行预处理,主要包括删除无用属性及信息、规范化检测项目名称风险指标、规范化检测结果数据、缺失值填充、删除异常值等,得到有效抽检数据集;B.关联融合食品中多风险指标得到各样本的综合风险值;采用灰色关联分析法GRA计算各风险指标对样本风险的贡献权重向量,并通过将风险指标权重向量与污染物危害程度矩阵相乘进行食品样本风险融合得到食品样本的综合风险值;基于GRA确定风险指标权重和计算食品样本综合风险值的步骤如下:B1.构建抽检数据矩阵X;应用步骤A得到的有效抽检数据集构建抽检数据矩阵X;将数据集中的每一个风险指标污染物作为一个行向量,每一个样本作为一个列向量,污染物检出量作为矩阵元素,构建抽检数据矩阵X如下: 其中,xik为第k个样本的第i个风险指标的检测结果;i=1,2,...,m;k=1,2,...,n;m为风险指标的数量,n为样本的数量;B2.基于GRA关联融合食品中多个风险指标得到各风险指标对食品风险的贡献权重向量W;将抽检数据矩阵X看作m个指标向量,令参考指标向量为X1={x11,x12,...x1k,x1n},比较指标向量为Xi={xi1,xi2,...,xik,...,xin},i=1,2,...,m;k=1,2,...,n;应用GRA计算各指标向量之间的相关系数,在实际计算中,每个指标向量作一次参考向量,其余指标向量作比较向量,进而得到各指标对食品风险的贡献权重;具体包括如下步骤:1数据无量纲化;由于各指标的量纲不一定相同,无法比较,或在比较时难以得到正确的结论,因此在灰色关联分析时,首先需要进行无量纲化处理,具体如式1所示; 其中,yik表示第i个指标对应第k个样本的无量纲化值,i=1,2,...,m;k=1,2,...,n;2计算参考向量y1k和比较向量yik在样本k的灰色关联系数如式2所示, 其中ξik为灰色相关系数;i=1,2,...,m;k=1,2,...,n;ρ为调节参数,用于调节关联系数间的差异,ρ∈0,1,ρ越小差异越大,通常ρ=0.5;3计算参考向量y1和比较向量yi的相关系数如式3所示, 将每个指标作为参考向量一次,其余指标作为比较向量,由式3可得到所有指标相互之间的相关系数矩阵γ如下所示,q=1,2,...,m; 其中γiq表示第i个指标与第q个指标之间的相关系数;4计算风险指标权重得到指标贡献权重向量W;各指标对风险的贡献可以通过计算各指标相关系数的平均值来得到,具体由式4计算: 对用式5进行归一化处理即可得到各指标贡献权重wi,i=1,2,...,m; 则风险指标贡献权重向量W=[w1,w2,...,wm];B3.综合考虑各风险指标污染物的检出情况、标准限量和对风险的贡献权重,计算历史抽检数据集中所有样本的综合风险值;具体步骤如下:1将风险指标的检测值与其对应的标准限量值相比得到食品中污染物危害程度值dik,计算方法如式6所示,并构建污染物危害程度矩阵D; 其中,xik表示第k个样本的第i个风险指标检出值,li表示第i个风险指标污染物的标准最大限量,i=1,2,...,m;k=1,2,...,n;m为风险指标的数量,n为样本的数量;2用指标权重向量W与污染物危害程度矩阵D相乘即可得到所有食品样本的综合风险值向量R,具体如式7所示; 其中,W=[w1,w2,...,wm]为各指标对食品风险的贡献权重向量,D为污染物的危害程度矩阵,R=[r1,r2,...,rn]为n个样本的综合风险值向量;C.构建并训练优化基于TabNet的食品安全风险预测模型,得到训练好的食品安全风险预测模型;基于TabNet构建食品安全风险预测模型,将步骤B1中得到的食品安全抽检数据矩阵X作为模型的输入,B3中食品样本的综合风险向量R作为预期输出,对模型进行训练,并使用贝叶斯优化算法对模型相关参数进行自适应搜索调优,得到训练好的食品风险预测模型;C1.构建基于TabNet的食品安全风险预测模型;本发明提出的基于TabNet的食品安全风险预测模型由Nsteps个顺序决策步组成,每个决策步主要由AttentivetransformerAt模块、Mask模块、FeaturetransformerFt模块、Split模块和ReLU激活函数组成,分别实现特征选择和特征处理;首先,TabNet模型每个决策步都输入相同的风险特征矩阵c,它由抽检数据矩阵X,经过批量归一化层BatchNormalization,BN处理得到,即c=BNX,其中,B表示Batchsize在训练过程中每次使用的食品样本个数,D表示特征风险指标的维数;此外,第i步的输入由第i-1步的输出经过At来决定哪个特征被使用,将经过Mask过滤后的特征输入到Ft中进行特征处理得到处理完成的风险特征y[i];放入Split模块进行分割,得到下一决策步输入a[i]和当前决策步的输出d[i]两部分,以供下一步的At特征选择以及整体输出使用;经过Nsteps个决策步后,将多步输出向量d[i]通过ReLU函数聚合得到dout,利用全连接层做一次变换,最终得到样本的综合风险值;总的决策过程具体包括如下步骤:1获取风险特征矩阵c及变量初始化;对抽检数据矩阵X进行批量归一化层BN处理得到风险特征矩阵c,即c=BNX,将风险特征矩阵c作为每个决策步的输入;初始化变量i=0,P[0]=1,a[0]=0;2令i=i+1,将a[i-1]输入At,学习得到Mask矩阵M[i];特征的重要程度由At实现,它通过学习一个Mask矩阵M[i]来实现对当前第i个决策步的特征选择,具体计算方法如式8:M[i]=sparsemaxP[i-1]·hia[i-1]8其中a[i-1]是由第i-1步的Split模块分割得到在当前决策步的输入信息,i=1,2,...,Nsteps,hi表示一个全连接层FullyConnected,FC和一个批量归一化层BN操作,其作用是实现特征的线性组合,从而抽取出更高维和抽象的特征;hia[i-1]和P[i-1]相乘,然后通过sparsemax生成所需的M[i];其中P[i]表示过去的决策步中特征的使用情况,由式9来更新; 其中,γ是一个松弛参数,当γ=1时,一个特征被强制只在一个决策步中使用;另外,sparsemax对每个样本b的每个风险特征j实现权重的分配,并使每个样本的所有风险特征的权重和为1,即D表示风险指标特征的维度,从而实现实例式风险特征选择;3将风险特征矩阵c和M[i]经过Mask模块,实现食品安全风险显著特征选择;由Mask模块实现显著特征的选择,使得模型在学习时关注对风险起主要贡献的风险指标,从而提高模型的学习效率;M[i]和风险特征矩阵c相乘实现当前决策步的特征选择,得到食品安全风险显著特征M[i]·c;4将显著特征M[i]·c输入到Ft中得到处理完成的风险特征y[i],具体计算方式如式10,其中fi是Ft模块操作,c为风险特征矩阵;y[i]=fiM[i]·c105将处理完成的风险特征y[i]放入Split模块进行分割,得到当前决策步的输出d[i],和作为下一决策步的输入a[i];处理完成的风险特征y[i被Split模块分成两部分,一部分用于当前决策步的输出d[i],另一部分作为下一决策步的输入a[i],Nd是总决策输出的特征数量,Na是下一步At模块输入的特征数量;6判断i是否小于Nsteps,若是则转到步骤2执行下一轮决策步,否则转到步骤7;7将所有决策步的输出向量聚合成dout,其中最后再用全连接层映射到最终的输出预测的综合风险值;C2.训练食品安全风险预测模型,获得模型最优参数;将步骤B1中得到的食品安全抽检数据矩阵X作为预测模型输入,步骤B3中得到的食品样本综合风险值向量R作为预期输出,使用贝叶斯优化算法对预测模型的相关参数进行自适应搜索调优,得到训练好的食品风险预测模型;D.对新抽检数据按步骤A进行预处理得到新的有效抽检数据集,再利用步骤C训练好的食品安全风险预测模型,即可直接获得新抽检数据集中各样本的综合风险值。

全文数据:

权利要求:

百度查询: 北京工商大学 一种基于TabNet-GRA的食品安全风险预测方法与可视分析系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。