申请/专利权人:上海市气象灾害防御技术中心(上海市防雷中心)
申请日:2021-02-05
公开(公告)日:2024-03-29
公开(公告)号:CN112818668B
主分类号:G06F40/242
分类号:G06F40/242;G06F40/289;G06F40/30;G06F16/35;G06F18/24
优先权:
专利状态码:有效-授权
法律状态:2024.03.29#授权;2021.06.04#实质审查的生效;2021.05.18#公开
摘要:本发明公开了一种气象灾情数据语义识别分析方法和系统,方法包括:灾种识别,建立由各灾种组成的灾种关键词字典,用于对案件发生情况描述进行识别匹配得到灾种字段;地址识别,建立小区名字典和道路名字典,用于对案件发生地址描述进行识别匹配得到小区名称和道路名称字段;程度识别,在灾种为暴雨的事件中,对积水深度的描述,采用提取关键词或者正则匹配方法将其转化为定量描述,构成积水深度字段;信息抽取,建立基于词向量的线性支持向量机分类模型,对案件发生情况描述进行分词后再进行文本分类,得到直接影响类型。本发明提出一种智能、稳定且数据处理能力强的气象灾情数据语义识别分析方法和系统。
主权项:1.一种气象灾情数据语义识别分析方法,其特征在于,包括:灾种识别,建立由各灾种组成的灾种关键词字典,用于对案件发生情况描述进行识别匹配得到灾种字段;所述灾种关键词字典根据重要性不同包含两级关键词字典,一级字典仅包含第一层关键词,二级字典包含第一层关键词和第二层关键词,其中:第一层关键词代表对气象灾害本身的描述性词语;第二层关键词代表对气象灾害所造成影响的描述性词语;在灾种识别中,先识别第一层关键词再识别第二层关键词,同层不同灾种关键词按照重要性由低到高顺序识别,且后识别的灾种替换先识别的灾种;在灾情事件情况描述文字中,按照积水深度的描述规律,包括数字描述类和物体描述类,其中:对于数字描述类,建立积水深度正则匹配表达式字典,采用正则匹配的方式识别数字和单位,并且通过单位转换得到以厘米为计量单位的积水深度数值;对于物体描述类,通过收集整理常用的描述物体字典,包含和身体有关的表述和汽车有关的表述,并查阅普通成年人身高参数及普通轿车参数,给出积水深度的定量描述字典,得到以厘米为计量单位的积水深度数值;地址识别,建立小区名字典和道路名字典,用于对案件发生地址描述进行识别匹配得到小区名称和道路名称字段;程度识别,在灾种为暴雨的事件中,对积水深度的描述,采用提取关键词或者正则匹配方法将其转化为定量描述,构成积水深度字段;信息抽取,建立基于词向量的线性支持向量机分类模型,对案件发生情况描述进行分词后再进行文本分类,得到直接影响类型。
全文数据:
权利要求:
百度查询: 上海市气象灾害防御技术中心(上海市防雷中心) 气象灾情数据语义识别分析方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。