买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法_中国矿业大学_201910316710.8 

申请/专利权人:中国矿业大学

申请日:2019-04-19

公开(公告)日:2021-02-02

公开(公告)号:CN110175194B

主分类号:G06F16/2458(20190101)

分类号:G06F16/2458(20190101);G06N3/12(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.02#授权;2019.09.20#实质审查的生效;2019.08.27#公开

摘要:本发明公开了一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法。首先,采用信息增益的遗传网络规划算法挖掘围岩监测的属性数据,提取关联规则,构建规则库;然后,基于平均适应度公式计算数据与规则之间的匹配度,将训练数据映射到平均适应度空间;最后,在平均适应度空间构建基于距离的围岩变形破裂检测模型,实现对煤矿巷道围岩变形破裂的辨识。本发明可挖掘大量围岩监测数据中隐含的机理性信息,也可以为巷道冒顶、冲击地压等灾害事故的防治提供参考依据。

主权项:1.一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,包括以下步骤:1采用信息增益的遗传网络规划算法挖掘围岩监测的属性数据,提取关联规则,构建规则库;对于遗传网络规划中每个判断节点的判断函数,根据信息增益度量当前判断函数与下一判断函数和围岩变形破裂程度之间的关联强度,将其作为与下一判断节点的链接概率;采用关联规则抽取方法生成规则库,具体过程如下:1a预设遗传网络规划的参数,包括进化代数、节点数、个体适应度函数、变异率和交叉率;预设分类规则的参数,包括支持度阈值、置信度阈值和卡方值阈值;1b预处理网络连接的训练数据,对数据划分子属性,并在遗传网络规划判断节点的基因结构中存储该子属性对应的信息增益;1c采用基于信息增益的遗传网络规划的个体结构表示规则,依次通过支持度阈值、置信度阈值、卡方值阈值和基于信息增益的概率选择方法的筛选后,加入规则库;1d对遗传网络规划种群中的个体依据适应度函数进行选择,并进行交叉和变异操作,实现种群进化;1f返回步骤1c,直至遗传网络规划种群进化到预设代数后结束,完成规则库的建立;2基于平均适应度公式,计算数据与规则之间的匹配度,将训练数据映射到平均适应度空间;定义训练数据与规则之间的匹配度Matchkd,r: 其中,Nkd,r表示训练数据d与规则r匹配的数据属性的数量,Nkr表示规则前件的属性总量;k表示类别,具体指代围岩结构破坏等级;计算训练数据与不同类别的规则库中所有规则的平均适应度: 其中,Rk表示属于k类的规则集合;将类别k分为正常等级N和严重破裂等级I,分别求取正常等级N类训练数据dN和严重破裂等级I类训练数据dI的平均适应度,并据此计算出正常等级N和严重破裂等级I两类训练数据在平均适应度空间上的中心点CNN,CIN和CNI,CII: 其中,mkdN和mkdI分别为数据dN和数据dI的平均适应度,k=I或N;DTrainN表示训练集中属于正常等级N的数据集,DTrainI表示训练集中属于严重破裂等级I的数据集;3在平均适应度空间构建基于距离的围岩变形破裂检测模型,实现对煤矿巷道围岩变形破裂的辨识,具体过程如下:3a将测试数据t在平均适应度空间上表示为mNt,mIt的坐标形式,mNt、mIt为测试数据t的平均适应度;3b根据下式计算测试数据t与正常等级N和严重破裂等级I训练数据中心点的距离D'Nt与D'It:D'Nt=mNt-CNN2+mIt-CNI212D'It=mNt-CNI2+mIt-CII2123c根据D'Nt和D'It判断煤矿巷道围岩变形程度,D'Nt值越小表示围岩变形量越小;D'It值越小则表示围岩变形程度越严重,危险性越高。

全文数据:一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法技术领域本发明属于煤矿巷道围岩长周期监测领域,特别涉及了一种快速进化的遗传网络规划算法进行关联规则提取的方法。背景技术深部煤矿井巷安全一直都是煤矿安全开采的重要问题。已知的冒顶、冲击地压、岩爆等煤矿安全事故灾害的主要诱因便是巷道围岩失稳造成的。因此,煤矿巷道围岩的长周期监测是防范煤矿井下安全事故灾害,提高经济效益的重要手段。现有的监测技术可从煤岩构造、应力场、地电场、地震场等多场角度获取大量围岩结构状态相关的数据信息,依据这些数据构成煤矿巷道围岩属性数据库、应力分布数据库等。在实现对这些数据分类管理的同时,缺乏深入的数据处理与分析。对现有监测数据进行挖掘,获取隐含的有用信息,从而揭示数据属性与围岩变形破裂的关联性,以达到围岩变形破裂分析的目的。这里的有用信息是以关联规则的形式,反映了大量数据属性间的隐含关系。Apriori算法使用逐层搜索技术来确定频繁项集,由项集中的频繁项来构成规则。由于算法需要多次遍历数据库,导致效率低下的同时造成频繁项集的冗余。遗传算法GA通过进化机制得到规则,进化作为一种启发式抽取规则方法,能有效避免Apriori算法的缺陷。在遗传算法中,单条基因串对应单条规则,引入遗传规划GP的树状结构也可用来抽取规则以解决规则库不充分的问题,同时过大的数据量和属性将会导致GP的结构膨胀问题。遗传网络规划GNP作为一种GA和GP的改进算法,能够抽取足够数量的规则。此外,它的网络状结构解决了GP树状结构的膨胀问题。GNP的结构优势使其能够挖掘出大量的关联规则。但是,随着属性的增加,使得GNP网络结构中节点数目增加,导致了遗传网络规划挖掘规则时进化速度慢,规则数量多,质量良莠不齐的问题。发明内容为了解决上述背景技术提到的技术问题,本发明提出了一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法。为了实现上述技术目的,本发明的技术方案为:一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,包括以下步骤:1采用信息增益的遗传网络规划算法挖掘围岩监测的属性数据,提取关联规则,构建规则库;对于遗传网络规划中每个判断节点的判断函数,根据信息增益度量当前判断函数与下一判断函数和围岩变形破裂程度之间的关联强度,将其作为与下一判断节点的链接概率;2基于平均适应度公式,计算数据与规则之间的匹配度,将训练数据映射到平均适应度空间;3在平均适应度空间构建基于距离的围岩变形破裂检测模型,实现对煤矿巷道围岩变形破裂的辨识。进一步地,在步骤1中,基于信息增益的链接概率Gain_Ratioai,P,K的表达式如下:Gain_Ratioai,P,K=IP∪{ai};K-IP;KH{ai}其中,I*表示互信息,H*表示信息熵;定义U为数据集合,其包含属性域A和标签域K,ai是属性集合A内的某种元素,{ai}为遗传进化过程中的节点属性集合,P是进化过程中符合筛选条件的属性集合,进一步地,在步骤1中,采用关联规则抽取方法生成规则库,具体过程如下:1a预设遗传网络规划的参数,包括进化代数、节点数、个体适应度函数、变异率和交叉率;预设分类规则的参数,包括支持度阈值、置信度阈值和卡方值阈值;1b预处理网络连接的训练数据,对数据划分子属性,并在遗传网络规划判断节点的基因结构中存储该子属性对应的信息增益;1c采用基于信息增益的遗传网络规划的个体结构表示规则,依次通过支持度阈值、置信度阈值、卡方值阈值和基于信息增益的概率选择方法的筛选后,加入规则库;1d对遗传网络规划种群中的个体依据适应度函数进行选择,并进行交叉和变异操作,实现种群进化;1f返回步骤1c,直至遗传网络规划种群进化到预设代数后结束,完成规则库的建立。进一步地,在步骤2中,定义训练数据与规则之间的匹配度Matchkd,r:其中,Nkd,r表示训练数据d与规则r匹配的数据属性的数量,Nkr表示规则前件的属性总量;k表示类别,具体指代围岩结构破坏等级;计算训练数据与不同类别的规则库中所有规则的平均适应度:其中,Rk表示属于k类的规则集合;将类别k分为正常等级N和严重破裂等级I,分别求取正常等级N类训练数据dN和严重破裂等级I类训练数据dI的平均适应度,并据此计算出正常等级N和严重破裂等级I两类训练数据在平均适应度空间上的中心点CNN,CIN和CNI,CII:其中,mkdN和mkdI分别为数据dN和数据dI的平均适应度,k=I或N;DTrainN表示训练集中属于正常等级N的数据集,DTrainI表示训练集中属于严重破裂等级I的数据集。进一步地,步骤3具体过程如下:3a将测试数据t在平均适应度空间上表示为mNt,mIt的坐标形式,mNt、mIt为测试数据t的平均适应度;3b根据下式计算测试数据t与正常等级N和严重破裂等级I训练数据中心点的距离D'Nt与D′It:D'Nt=mNt-CNN2+mIt-CNI212D′It=mNt-CNI2+mIt-CII2123c根据D'Nt和D′It判断煤矿巷道围岩变形程度,D'Nt值越小表示围岩变形量越小;D′It值越小则表示围岩变形程度越严重,危险性越高。采用上述技术方案带来的有益效果:本发明针对遗传网络规划在挖掘规则中存在的进化慢,规则质量低的问题,结合GNP和信息增益理论,改善了进化效率和规则挖掘质量,能够有效挖掘巷道围岩监测数据,提高围岩变形破裂程度分级模型的性能。附图说明图1是本发明的整体流程图;图2是本发明中关联规则抽取的流程图;图3是本发明中GNP个体的基本结构示意图;图4是本发明中关联规则在GNP个体上的表示图;图5是本发明中训练数据到平均适应度空间的映射图。具体实施方式以下将结合附图,对本发明的技术方案进行详细说明。根据煤矿井下巷道围岩特定区域的监测历史数据预处理形成集围岩物理力学属性、围岩结构状态属性的事务型数据集D。数据集中的每条记录视为一条“事务数据”,记为di。D={d1,d2,…,di,…,dn}如图1所示,一种快速进化的遗传网络规划数据挖掘算法,包括规则抽取机制和数据分类机制,步骤如下:步骤1:采用快速进化的遗传网络规划算法挖掘围岩物理力学属性、围岩结构状态属性的关联规则,构建规则库;对于遗传网络规划中每个判断节点的判断函数,根据信息增益度量判断函数与数据类别之间的关联强度,将其作为下一节点链接概率。遗传网络规划是一种有向图结构的进化计算方法,包括3种节点,起始节点、处理节点和判断节点。作为一种进化计算方法,遗传网络规划根据数据属性数量定义每个个体的判断节点数和处理节点数,确定个体网络结构在每个个体中,数据属性及其取值对应不同的判断节点函数,处理节点表示关联规则的起始和结束;节点与节点之间采用有向连接方式,判断节点通过判断函数的计算结果确定连接的下一节点。对于每个判断节点的判断函数,根据信息增益度量判断节点函数与数据类别之间的关联强度,作为下一节点的链接概率。采用关联规则抽取方法生成规则库,如图2所示,具体过程如下:1a预设遗传网络规划的参数,包括进化代数、节点数、个体适应度函数、变异率和交叉率;预设分类规则的参数,包括支持度阈值、置信度阈值和卡方值阈值;1b预处理训练数据,对数据划分子属性,并在遗传网络规划判断节点的基因结构中存储该子属性对应的信息增益;1c采用基于信息增益的遗传网络规划的个体结构表示规则,依次通过支持度阈值、置信度阈值、卡方值阈值和基于信息增益的概率选择方法的筛选后,加入规则库;1d对遗传网络规划种群中的个体依据适应度函数进行选择,并进行交叉和变异操作,实现种群进化;适应度函数定义如下:其中,χ2r表示关联规则中前后项之间的相关性,Gain_Ratior表示规则的信息增益率,αnewr表示新规则的加权。当GNP发现新的关联规则时,往往会为之赋予一个较大的权重,r指代某条特定规则,R指代全体规则库;1f返回步骤1c,直至遗传网络规划种群进化到预设代数后结束,完成规则库的建立。图3显示了遗传网络规划种群中的个体结构。遗传网络规划的个体由一个起始节点,多个判断节点和处理节点组成。节点与节点之间采用有向连接的方式。起始节点没有功能和条件分支,其唯一作用是确定要执行的第一个节点;判断节点从环境中获取和判断信息,并确定下一个节点的指向;处理节点描述了GNP的处理功能,其与判断节点相比没有条件分支。图3右侧显示了GNP节点的基因结构。Ki表示节点类型,Ki=0、1和2分别对应了起始节点、判断节点和处理节点。IDi是节点功能的标识号,例如Ki=1,IDi=1表示节点i是判断节点J1,负责对一特定的子属性做判断。Cin显示从节点i的分支链接的节点编号。IGi是判断节点特有的结构,存储该判断节点所判断属性的信息增益。图4显示了关联规则在GNP个体上的表示,可以说明由GNP个体提取规则的原理。图4中,N是数据库中的数据总量,a、b、c和d分别表示在每个判断节点指向YES的数据量。ak,bk,ck和dk分别是具有分类标签k的数据在每个判断节点指向YES的统计数量,Ai在这里表示规则进化的流程。假设具有分类标签k的数据在数据库中的总量是yk,然后类别关联规则A1→C∈k的卡方值、支持度和置信度可分别通过下式计算得出:为了计算节点的信息增益率,这里定义U是数据库的集合,包含属性域A和标签域K,P是进化过程中符合筛选条件的属性集合。互信息可以由IK;P=HP-HP|K得到,HP与HP|K是分别是信息熵和条件熵,用于衡量属性的信息度以及属性与数据类型之间的关系。Pai表示概率,即ai此属性在总数据集中的比例,可用计算。ai是属性集合A内的某种元素,在遗传进化过程中的节点属性集合表示为{ai},kj为K中的某一标签,m为K中标签数目,n为属性数目。根据信息增益度量判断节点函数与数据类别之间的关联强度,作为下一节点的链接概率,基于信息增益的链接概率Gain_Ratioai,P,K的表达式如下:Gain_Ratioai,P,K=IP∪{ai};K-IP;KH{ai}步骤2:基于平均适应度公式,计算数据与规则之间的匹配度,将训练数据映射到平均适应度空间。定义训练数据与规则之间的匹配度Matchkd,r:其中,Nkd,r表示训练数据d与规则r匹配的数据属性的数量,Nkr表示规则前件的属性总量,k表示类别。计算训练数据与不同类别的规则库中所有规则的平均适应度:其中,Rk表示属于k类的规则集合。将类别k分为正常等级N和严重破裂等级I,分别求取正常等级N类训练数据dN和严重破裂等级I类训练数据dI的平均适应度,并据此计算出正常等级N和严重破裂等级I两类训练数据在平均适应度空间上的中心点CNN,CIN和CNI,CII:其中,mkdN和mkdI分别为数据dN和数据dI的平均适应度,k=I或N;DTrainN表示训练集中属于正常等级N的数据集,DTrainI表示训练集中属于严重破裂等级I的数据集。图5显示了训练数据映射到平均适应度空间的原理。步骤3:在平均适应度空间构建基于距离的围岩变形破裂检测模型,实现对煤矿巷道围岩变形破裂的辨识首先,将测试数据t在平均适应度空间上表示为mNd,mId的坐标形式。然后,根据下式计算测试数据t与正常等级N和严重破裂等级I训练数据中心点的距离D'Nt与DI't:D'Nt=mNt-CNN2+mIt-CNI212D′It=mNt-CNI2+mIt-CII212最后,根据D'Nt和D′It判断煤矿巷道围岩变形程度,D'Nt值越小表示围岩变形量越小;D′It值越小则表示围岩变形程度越严重,危险性越高。实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

权利要求:1.一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,包括以下步骤:1采用信息增益的遗传网络规划算法挖掘围岩监测的属性数据,提取关联规则,构建规则库;对于遗传网络规划中每个判断节点的判断函数,根据信息增益度量当前判断函数与下一判断函数和围岩变形破裂程度之间的关联强度,将其作为与下一判断节点的链接概率;2基于平均适应度公式,计算数据与规则之间的匹配度,将训练数据映射到平均适应度空间;3在平均适应度空间构建基于距离的围岩变形破裂检测模型,实现对煤矿巷道围岩变形破裂的辨识。2.根据权利要求1所述基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,在步骤1中,基于信息增益的链接概率Gain_Ratioai,P,K的表达式如下:Gain_Ratioai,P,K=IP∪{ai};K-IP;KH{ai}其中,I*表示互信息,H*表示信息熵;定义U为数据集合,其包含属性域A和标签域K,ai是属性集合A内的某种元素,{ai}为遗传进化过程中的节点属性集合,P是进化过程中符合筛选条件的属性集合,3.根据权利要求1所述基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,在步骤1中,采用关联规则抽取方法生成规则库,具体过程如下:1a预设遗传网络规划的参数,包括进化代数、节点数、个体适应度函数、变异率和交叉率;预设分类规则的参数,包括支持度阈值、置信度阈值和卡方值阈值;1b预处理网络连接的训练数据,对数据划分子属性,并在遗传网络规划判断节点的基因结构中存储该子属性对应的信息增益;1c采用基于信息增益的遗传网络规划的个体结构表示规则,依次通过支持度阈值、置信度阈值、卡方值阈值和基于信息增益的概率选择方法的筛选后,加入规则库;1d对遗传网络规划种群中的个体依据适应度函数进行选择,并进行交叉和变异操作,实现种群进化;1f返回步骤1c,直至遗传网络规划种群进化到预设代数后结束,完成规则库的建立。4.根据权利要求1所述基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,在步骤2中,定义训练数据与规则之间的匹配度Matchkd,r:其中,Nkd,r表示训练数据d与规则r匹配的数据属性的数量,Nkr表示规则前件的属性总量;k表示类别,具体指代围岩结构破坏等级;计算训练数据与不同类别的规则库中所有规则的平均适应度:其中,Rk表示属于k类的规则集合;将类别k分为正常等级N和严重破裂等级I,分别求取正常等级N类训练数据dN和严重破裂等级I类训练数据dI的平均适应度,并据此计算出正常等级N和严重破裂等级I两类训练数据在平均适应度空间上的中心点CNN,CIN和CNI,CII:其中,mkdN和mkdI分别为数据dN和数据dI的平均适应度,k=I或N;DTrainN表示训练集中属于正常等级N的数据集,DTrainI表示训练集中属于严重破裂等级I的数据集。5.根据权利要求4所述基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法,其特征在于,步骤3具体过程如下:3a将测试数据t在平均适应度空间上表示为mNt,mIt的坐标形式,mNt、mIt为测试数据t的平均适应度;3b根据下式计算测试数据t与正常等级N和严重破裂等级I训练数据中心点的距离D′Nt与D′It:D′Nt=mNt-CNN2+mIt-CNI212D′It=mNt-CNI2+mIt-CII2123c根据D′Nt和D′It判断煤矿巷道围岩变形程度,D′Nt值越小表示围岩变形量越小;D′It值越小则表示围岩变形程度越严重,危险性越高。

百度查询: 中国矿业大学 一种基于关联规则挖掘的煤矿巷道围岩变形破裂辨识方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。