买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种网络违法行为风险危险等级评估方法_中国标准化研究院_202311534786.0 

申请/专利权人:中国标准化研究院

申请日:2023-11-17

公开(公告)日:2024-04-26

公开(公告)号:CN117556339B

主分类号:G06F18/2413

分类号:G06F18/2413;G06F18/23;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.03.01#实质审查的生效;2024.02.13#公开

摘要:本发明公开了一种网络违法行为风险危险等级评估方法,包括获取网络行为数据,对所述网络行为数据进行预处理,对所述网络行为数据进行第一聚类获得第一分类数据,对所述网络行为数据进行第二聚类获得第二分类数据,将所述第一分类数据输入风险等级评估模型获得风险程度,将所述第二分类数据输入离散评估模型获得偏离程度,对所述风险程度和所述偏离程度进行聚类分析,获得风险危险等级并输出。该方法不仅可以提高网络违法行为风险危险等级评估方法的精度,同时具有较好的可解释性,可以直接应用于网络违法行为风险危险等级评估系统中。

主权项:1.一种网络违法行为风险危险等级评估方法,其特征在于,包括以下步骤:获取网络行为数据,对所述网络行为数据进行预处理;对所述网络行为数据进行第一聚类获得第一分类数据,对所述网络行为数据进行第二聚类获得第二分类数据;将所述第一分类数据输入风险等级评估模型获得风险程度,将所述第二分类数据输入离散评估模型获得偏离程度;对所述风险程度和所述偏离程度进行聚类分析,获得风险危险等级并输出;“对所述网络行为数据进行第一聚类获得第一分类数据”包括:将网络行为数据输入为数据集,假设有r个近邻个数,计算数据集重数据点间的欧式距离: 其中第i个数据为ci,第j个数据为cj,第i个数据的x轴值为xi,第j个数据的x轴值为xj,第i个数据的y轴值为yi,第j个数据的y轴值为yj,数据ci和数据cj的欧式距离为kci,cj,构建距离矩阵Q;根据距离矩阵和k近邻定义获取数据点的k近邻居,计算数据的k近邻数量; 其中数据ci的k近邻居为wci,数据cj的k近邻居为wcj,数据ci的k近邻数量为ngrci,数据ci与数据cj的k近邻判断函数为grci,cj,计算数据的局部核密度: 其中数据c的高斯核函数为gc,数据维度为d,数据c的范数为||c||,数据ci与第k近邻的数据cj间的距离kaci,cj,数据ci的局部核密度为kgci,自然对数为e,计算数据的局部密度和相对距离:βci=ngrci+kgci 其中数据ci的局部密度为βci,第i个数据的相对距离为δi,第j个数据的高斯函数为ρj,第i个数据的高斯函数为ρi,根据局部密度βci和相对距离δi构建决策图选取聚类中心,赋予类标签;将不属于任何类中心的数据分配到局部密度更高且距离更近的数据所属的类别中,直到遍历完数据集内所有的数据,得到第一分类数据;“对所述网络行为数据进行第二聚类获得第二分类数据”包括:输入行为数据构成数据集,利用轮廓系数法确定聚类的个数,随机选取m个对象作为第二聚类中心;计算数据到第二聚类中心的欧式距离: 其中第v个聚类中心为pv,第r个数据为br,数据br与聚类中心pv的欧拉距离为sr,v,将数据到所有聚类中心的欧拉距离升序排序,将数据br分配给第一个聚类中心,形成m个簇;确定数据所在高维有界闭箱,在有界闭箱内生成z个初始生长点,计算生长点的形态素浓度: 其中第d个维度数据v的适应度函数为第d个维数数据e的适应度函数为数据r的数量为p,聚类中心的数量为n;构造[0,1]封闭区间内的概率生长空间,确定随机数h的生长点,如果Xe-1<h<Xe,选取作为本次迭代的生长点,将新生长点与原生长点进行比较,选择性能更优的生长点代替原来的候选生长点完成生长过程;重复迭代,直到达到预先设定的迭代次数,迭代终止,输出全局最优生长点Od,更新聚类中心将全局最优生长点作为簇的聚类中心,将聚类结果输出为第二分类数据;“将所述第一分类数据输入风险等级评估模型获得风险程度”包括:将第一分类数据输入风险等级评估模型,将第一分类数据转换成叶子节点,从二叉压缩树中找到节点a对应的叶子节点,从叶子节点中检索与风险等级评估相关联的哈希值;通过哈希值找到与评估风险等级的第一分类数据获得评估数据,将评估数据按照评估者对象分为不同的评估序列;计算评估数据的直接风险程度:Eba=upa其中节点b对节点a的风险率为uba,节点b对节点a的直接风险程度为Eba,计算评估数据的间接风险程度: 其中节点b对节点a的间接风险程度为Vba,节点为k,节点的数量为t,节点k对被评价节点b的评价总数为|Mba|,被评估节点a得到的评价总数为计算间接风险程度的权重: 其中间接风险程度的权重为γ,计算综合风险程度:Xba=max{1-γEba+γVba,α}其中节点的初始综合风险程度为α,输出综合风险程度为风险程度;“将所述第二分类数据输入离散评估模型获得偏离程度”包括:将第二分类数据输入离散评估模型,给定最大似然估计: 其中最大似然估计为H,第k个第二分类数据矩阵为uk,第二分类数据的数量为r,第二分类数据矩阵的平均矩阵为矩阵的转置为·T;根据最大似然估计调整离散评估模型的模型,对第二分类数据进行拟合,计算偏离程度: 其中第二分类数据x的偏离程度为σx,第二分类数据x的数量为s,第二分类数据的数值为gx,第二分类数据x的聚类中心值为cx,输出偏离程度;“对所述风险程度和所述偏离程度进行聚类分析”包括:给定聚类的目标函数: 其中n×p的0、1矩阵为E,聚类中心数据集为R,第k个类的中心点为zk,第s个数据为cs,中心点zk与数据cs的分类变量间的距离为dcs,zk,数据的数量为n,中心点的数量为p,计算属性值的属性权重: 其中第s个数据的本地属性为bs,第s个数据的第g个角度度量为cgs,本地属性bs的角度度量cgs的单属性权重为数据对象cp在本地属性bs的等价类为第a个相关属性为ba,相关属性ba的角度度量cgs的多属性权重为属性值cgs的权重为ωcgs,属性值cgs和属性值cga的共现次数为相关属性的数量为d,随机初始找出簇中心,平均权重集并对应属性值的权重,计算数据对象与簇之间的距离: 其中第s个数据的第t个属性值为cst,第a个数据的第t个属性值为cat,属性值cst和属性值cat簇之间的距离为dcst,cat,属性值cst的权重为ωcst,属性值cat的权重为ωcat,根据聚类分析将风险程度和偏离程度分成不同的群组,计算不同群组的风险等级:Ls=ωsdrhdrs+ωsvahvas其中行为数据s的风险等级为Ls,数据s的风险程度权重为ωsdr,数据s的偏离程度权重为ωsva,数据s的风险程度为hdrs,数据s的偏离程度为hvas,输出风险等级。

全文数据:

权利要求:

百度查询: 中国标准化研究院 一种网络违法行为风险危险等级评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。