买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于网络爬虫方式的智能评估方法_中国农业科学院农业环境与可持续发展研究所_202310463992.0 

申请/专利权人:中国农业科学院农业环境与可持续发展研究所

申请日:2023-04-26

公开(公告)日:2024-04-09

公开(公告)号:CN116433032B

主分类号:G06Q10/0635

分类号:G06Q10/0635;G06Q50/26;G06F16/951;G06F18/23;G06F18/20;G06F17/16;G06F17/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.08.01#实质审查的生效;2023.07.14#公开

摘要:本发明提供了一种基于网络爬虫方式的智能评估方法,包括:步骤1:根据来源类型,构建网络资源,且从所述网络资源中的每个第一子资源中筛选与目标灾害相关的损失关键词,并建立损失评价体系;步骤2:采用网络爬虫方式对所有第一资源分别进行资源检索;步骤3:根据资源检索结果,统计锁定时间段内的不同灾害类型的灾害事件的第一出现概率,来作为相应二级指标的第一出现权重,进而确定每个三级指标基于对应二级关键指标的第二出现权重;步骤4:基于所述第一出现权重以及第二出现权重,确定每个二级指标的出现条件概率,进而确定相应二级指标的指标条件概率等步骤。

主权项:1.一种基于网络爬虫方式的智能评估方法,其特征在于,包括:步骤1:根据来源类型,构建网络资源,且从所述网络资源中的每个第一子资源中筛选与目标灾害相关的损失关键词,并建立损失评价体系;步骤2:采用网络爬虫方式对所有第一子资源分别进行资源检索;步骤3:根据资源检索结果以及损失评价体系,统计锁定时间段内的不同灾害类型的灾害事件的第一出现概率,来作为相应二级指标的第一出现权重,进而确定每个三级指标基于对应二级指标的第二出现权重;步骤4:基于所述第一出现权重以及第二出现权重,确定每个二级指标的出现条件概率,进而确定相应二级指标的指标条件概率;步骤5:基于确定的二级指标的指标条件概率以及相应一级指标的设定权重,计算得到对应一级指标的第三出现权重;步骤6:基于每个第三出现权重以及相匹配的灾害损失,获取得到灾害评估结果;其中,根据来源类型,构建网络资源,包括:获取每个来源类型的类型编码,并从资源数据库中匹配与所述类型编码一致的初始资源;基于所述资源数据库的检索工具,来获取相应的匹配日志,并对所述匹配日志进行聚类分析,得到每个聚类结果对应的聚类类型,确定历史匹配窗口;获取每个历史匹配窗口的窗口编码以及窗口使用频次,向对应历史匹配窗口赋予第一权重;统计同聚类类型中所有历史匹配窗口的总窗口使用频次以及对应同聚类类型中每次匹配资源基于该次总匹配资源的资源占比,向对应聚类类型赋予第二权重;基于所述第一权重以及第二权重,得到对应初始资源的资源有效性;对所述资源有效性进行排序,并对前n0个初始资源所对应的来源类型进行全部保留,对剩余初始资源所对应的来源类型进行临时保留;判断全部保留的来源类型所对应的资源信息是否满足资源构建标准;若满足,则将对应的资源信息作为网络资源;若不满足,则获取每个剩余来源类型的资源关系网络以及资源使用网络;根据所述资源关系网络以及资源使用网络,从匹配的剩余初始资源中筛选可用资源;构建对应可用资源的第一可用函数,同时,构建满足资源构建标准的第二可用函数;根据所述第一可用函数对所述第二可用函数进行资源扩展,得到网络资源,包括:确定所述第一可用函数所涉及到的资源来源的第一数量以及确定所述第二可用函数所涉及到的资源来源的第二数量;根据临时保留的资源来源的第三数量、第一数量以及第二数量,计算所述第一可用函数对所述第二可用函数的适配系数; 其中,P0表示适配系数;B1表示基于第一可用函数确定的所有可用资源;B2表示基于第二可用函数确定的所有网络资源;ln表示对数函数符号;m3表示第三数量;m1表示第一数量;m2表示第二数量;表示第一可用函数所涉及来源数量的第一权重;表示第二可用函数所涉及来源数量的第二权重;当所述适配系数大于或等于预设系数时,将所述第一可用函数涉及到的可用资源补充到所述第二可用函数涉及到的网络资源中;否则,确定每个剩余来源的来源资源存在的相关资源,并补充到所述第二可用函数涉及到的网络资源中;其中,第一权重的计算公式如下: 其中,Qj表示第j个历史匹配窗口的第一权重;qj表示第j个历史匹配窗口基于编码-设置映射表的设置权重;M01表示与同个类型编码下的不同窗口编码所匹配的历史窗口的窗口数量;pj表示第j个历史匹配窗口的窗口使用频次;资源有效性的计算公式如下: 资源平均占比指的是同匹配日志下的所有资源占比的平均值;sum{Qj}表示对所有Qj进行求和;sum表示求和函数符号;其中,根据来源类型,构建网络资源,且从所述网络资源中的每个第一子资源中筛选与目标灾害相关的损失关键词,并建立损失评价体系,包括:筛选每个第一子资源中的损失初始词,并与词性数据库进行匹配,向每个损失初始词进行词性标注,其中,每个第一子资源中包括n1个损失初始词;对每个第一子资源中的每个损失初始词按照进行随机组合,获取得到个组合阵列,其中,rand表示随机函数;n1表示对应第一子资源中所包含的损失初始词的总个数;[]表示取整函数;按照组合阵列的词性组合,从词分析数据库中调取词分析方式,对相应词性组合进行匹配分析,将数量最大的前两个匹配分析结果进行保留,并构建匹配子矩阵,其中,所述匹配子矩阵为2行列;基于所有匹配子矩阵,构建得到初始矩阵,其中,初始矩阵为2×m4列列,其中,m4表示第一子资源的资源个数;表示从所有第一子资源中所对应的列的最大数量,且对所述初始矩阵中的空闲位置进行0设置;并对所述初始矩阵中的一致行向量进行留一删除,得到第一矩阵;锁定所述第一矩阵中存在的最多有效元素的第一行,并将所述第一行分别与其余每一行进行交集匹配,同时,锁定同元素基于列的出现次数大于预设个数的第一元素;根据交集匹配结果以及第一元素,确定损失关键词;将所有损失关键词进行整合,建立损失评价体系。

全文数据:

权利要求:

百度查询: 中国农业科学院农业环境与可持续发展研究所 基于网络爬虫方式的智能评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。