买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于百度指数的人口出生率预测方法与预测系统_合肥工业大学_202311697590.3 

申请/专利权人:合肥工业大学

申请日:2023-12-12

公开(公告)日:2024-03-22

公开(公告)号:CN117743748A

主分类号:G06F17/18

分类号:G06F17/18;G06F18/2135;G06Q50/26;G06F16/953

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.09#实质审查的生效;2024.03.22#公开

摘要:本发明公开了一种基于百度指数的人口出生率预测方法与预测系统,涉及出生率预测领域,预测方法包括:对关键词数据进行处理;使用主成分分析法对关键词数据进行降维,并建立多元MIDAS模型;根据每个关键词数据构建单变量预测模型;利用单变量预测模型构建组合预测模型;对比两种建模方法的预测精度,选择预测精度最高的输出结果作为预测结果。本发明在对相关数据进行处理和整理后,利用MIDAS模型,将高频百度指数数据纳入到人口出生率的预测中,对中国人口出生率的变化进行了相关预测研究,通过百度指数这一庞大的数据库来对中国人口出生率进行了全面的预测,解决了现有人口出生率所依赖的基础数据的缺陷,极大的增加了预测的准确性以及全面性。

主权项:1.一种基于百度指数的人口出生率预测方法,其特征在于,所述预测方法包括:S1:对关键词数据进行处理;获取出生率预测所需要的关键词,并对关键词进行筛选;S11:获取初始关键词;根据与生育相关医检类、症状类、产前类及其他类四项确定关键词,依据百度指数的需求图谱找出与这些关键词相关的关键词,最终获取若干个初始关键词,并在百度指数爬取该关键词历年来PC和移动端的搜索量;S12:筛选初始关键词;采取相关性、全面性、可获取性以及信息完整性四种原则对初始关键词进行初步筛选,并对关键词数据进行缺失值的检验筛选,然后对剩余的关键词数据进行S-H-ESD异常值检验最终筛选;S2:使用主成分分析法对关键词数据进行降维,并建立多元MIDAS模型;使用主成分分析法对若干个关键词数据提取主要成分,对所有的关键词数据进行降维,将提取出的主要成分代入到标准模型中,进行参数的估计及多元MIDAS模型的建立;所述多元MIDAS模型可以表示为: 其中:yt+1表示t+1时的低频被解释变量;表示t时刻第i个高频解释变量,mi表示该高频变量与被解释变量的频率倍数差,即高频变量在低频间隔t-1到t时期内进行了mi次抽样;εt+1表示随机扰动项,服从均值为零的正态分布;B.表示权重函数和滞后算子的多项式函数,而: 其中:K表示滞后阶数;表示滞后算子;权重函数需满足S3:根据每个关键词数据构建单变量预测模型;所述单变量预测模型可以表示为: 其中:yt为低频被解释变量;为高频解释变量,m表示该高频变量与被解释变量的频率倍数差,即高频变量在低频间隔t-1到t时期内进行了M次抽样;εt表示随机扰动项,服从均值为零的正态分布;表示权重函数和滞后算子的多项式函数;由于人口出生率存在自相关性,即本期被解释变量还受上一期被解释变量的影响,模型中引入带有滞后阶数的被解释变量;故带有自回归项的单变量预测模型可具体表示如下: S4:利用单变量预测模型构建组合预测模型;选择合适的权重方法将多个单变量预测模型组合成一个多变量预测模型进行预测;所述组合预测模型的构建步骤如下:1对不同关键词数据建立的单变量预测模型的预测结果赋予权重,利用不同的权重方法构建成多个组合预测模型;2通过均方根误差、平均绝对误差以及平均绝对百分比误差来对比各个组合预测模型的评测精度;3选择预测误差最小的组合预测模型作为最终的组合预测模型;S5:对比两种建模方法的预测精度,选择预测精度最高的输出结果作为预测结果。

全文数据:

权利要求:

百度查询: 合肥工业大学 一种基于百度指数的人口出生率预测方法与预测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。