买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于决策树的页岩气开发主控因素分析方法_中国石油天然气股份有限公司_202110570373.2 

申请/专利权人:中国石油天然气股份有限公司

申请日:2021-05-25

公开(公告)日:2024-04-30

公开(公告)号:CN113153286B

主分类号:G06F30/20

分类号:G06F30/20;E21B49/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2022.12.16#著录事项变更;2021.08.10#实质审查的生效;2021.07.23#公开

摘要:本发明公开了基于决策树的页岩气开发主控因素分析方法,包括步骤:S1,获取页岩气开发数据集;S2,基于获取的页岩气开发数据集,建立决策树模型;S3,训练决策树模型;S4,基于训练后的决策树模型,计算特征重要性S5,根据特征重要性分析判断主控因素等;本发明可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。

主权项:1.基于决策树的页岩气开发主控因素分析方法,其特征在于,包括步骤:S1,获取页岩气开发数据集;S2,基于获取的页岩气开发数据集,建立决策树模型;S3,训练决策树模型;S4,基于训练后的决策树模型,计算特征重要性;S5,根据特征重要性分析判断主控因素;在步骤S1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集D,且数据集D中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为A;在步骤S2中,所述决策树模型采用CART回归树,在选定的某一决策树节点,对于任意划分的特征A,对应的任意划分点s,数据集D划分成数据集D1和D2,作如下和方差计算处理: 其中,为样本输入,为样本输出,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值;然后,设定节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度作为CART回归树终止标准;在步骤S3中,训练决策树模型时,输入为训练集,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立CART回归树;用训练集递归地建立CART回归树,包括如下步骤:S31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;S32,对于当前节点的数据集,如果样本个数小于节点最小样本个数阈值,当前节点停止递归;S33,计算样本集的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;S34,计算当前节点现有的各个特征的各个划分点对数据集D的和方差,选择和方差最小的特征A和对应的划分点s;根据这个最小特征和划分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右子节点,左子节点的数据集为D1,右子节点的数据集为D2;S35,重复步骤S31~S34,依此递归下去,直到达到终止标准;在步骤S4中,包括步骤:S41,计算节点j的重用性,计算公式如下: 其中,代表节点j的和方差,代表到达节点j的加权样本数量,通过达到节点j的样本数除以样本总数来计算,、分别代表左子节点和右子节点的和方差,,分别代表左子节点和右子节点的加权样本数量;S42,计算特征i的重要性,计算公式如下: 其中, ;在步骤S5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。

全文数据:

权利要求:

百度查询: 中国石油天然气股份有限公司 基于决策树的页岩气开发主控因素分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术