买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种集成地理大数据和机器学习的城镇开发边界划定方法_南京大学_202310597567.0 

申请/专利权人:南京大学

申请日:2023-05-25

公开(公告)日:2024-04-05

公开(公告)号:CN116644809B

主分类号:G06N5/01

分类号:G06N5/01;G06N20/00;G06Q10/0639;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2023.09.12#实质审查的生效;2023.08.25#公开

摘要:本发明公开一种集成地理大数据和机器学习的城镇开发边界划定方法,本方法包括以下步骤:S1、收集的大量多源地理大数据进行数据清洗等预处理;S2、从自然要素、生态要素、人文要素三个维度构建指标因子,从单因子角度分析城镇开发边界适宜性,并得到各评价指标的评分标准;S3、构建随机森林模型来确定各指标权重。本发明基于空间调查数据等基础地理数据,融合夜间灯光、微博签到、房屋地价数据等地理大数据集成多源地理大数据,从自然、人文、生态三个维度选取全面合理的因子构建城镇开发边界适宜性指标体系,以人工绘制的边界为参考,使用机器学习方法确定权重,划定城镇开发边界。

主权项:1.一种集成地理大数据和机器学习的城镇开发边界划定方法,其特征在于:本方法包括以下步骤:S1、收集的大量多源地理大数据进行数据清洗等预处理;S2、从自然要素、生态要素、人文要素三个维度构建指标因子,从单因子角度分析城镇开发边界适宜性,并得到各评价指标的评分标准;S3、构建随机森林模型来确定各指标权重,具体为:首先用UGBr对模型进行训练,UGBr为UGB参考数据,将训练数据中是UGB属性的区域赋值为1,其他区域赋值为0,作为用地状态值,运用随机分层抽样的方法,分别抽取训练数据中UGB和其他区域各10%的样本点并获取这些样本点的空间坐标,运用ArcGIS的Sample功能读取样本点对应的用地状态值和空间变量值,得到原始训练集X,将指标体系中若干个指标的评价分级结果栅格数据统一成tif格式,输入随机森林模型中得到空间变量数据集,随机森林是以决策树作为基分类器的一种组合算法,决策树是一种由节点和有向边组成的树状预测模型,在每个内部节点,从原始变量中随机抽出mtry个预测变量作为分裂节点的候选变量,然后在其中选出分裂方式对该节点进行分裂,重复操作,直到生成ntree棵决策树;使用Python为编程语言,采用机器学习开源工具包Scikit-learn,输入原始训练集X训练生成随机森林模型,在训练过程中,对两个参数ntree和mtry进行设定,mtry作为每个节点从原始变量中随机抽取的预测变量数,中选择具有分类能力的变量进行节点分裂;同时随机森林组合多棵决策树的预测,再通过投票得到最终的预测结果,mtry、ntree的设置会对预测的精度造成影响,使用OOB误分率估计模型的性能,作为测算分类精度的指标,通过不断调整以确定合适的参数来提高预测精度;S4、得到评价指标体系和各指标1—4分适宜性分级结果后,根据随机森林模型确定的指标权重进行多因子叠加分析,使用ArcGIS工具将每个格网各指标的适宜性分值按指标权重加权叠加得出研究区各格网最终的城镇开发边界适宜性评价分值,从而综合评价得到各格网划定为城镇开发边界的适宜程度;S5、以不同适宜性分值作为划分城镇开发边界的阈值,并讨论不同阈值下划定的城镇开发边界的总体精度和Kappa系数,选取精度相对最高的分值确定为本研究划分城镇开发边界的阈值,格网适宜性分值大于此分值的划定为城镇开发边界,小于的则不适合划定为城镇开发边界,据此得到本实验最终的城镇开发边界划定结果。

全文数据:

权利要求:

百度查询: 南京大学 一种集成地理大数据和机器学习的城镇开发边界划定方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。