买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于文本分析和识别的政策文本分析方法_杭州正策信息科技有限公司_202310493599.6 

申请/专利权人:杭州正策信息科技有限公司

申请日:2023-05-05

公开(公告)日:2024-03-22

公开(公告)号:CN116629254B

主分类号:G06F40/289

分类号:G06F40/289;G06F40/216;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2023.09.08#实质审查的生效;2023.08.22#公开

摘要:本发明提供一种基于文本分析和识别的政策文本分析方法,属于数据处理技术领域,具体包括:基于政策文本的题目确定政策文本的类型;获取政策文本的段落数,基于政策文本的段落数、字符数量、类型得到重要度评估值,并判断其是否大于预设评估值,若是,则将政策文本的所有段落作为文本分析段落,若否,则基于文本类型确定政策文本的核心关键词,并基于核心关键词确定文本分析段落;基于文本分析段落进行关键词的提取得到文本关键词,并基于文本关键词的词频、文本关键词的类型、政策文本的文本类型确定其权值,并基于文本关键词、文本关键词的权值得到政策文本的文本解析结果,从而进一步提升了文本解析的准确性和可靠性。

主权项:1.一种基于文本分析和识别的政策文本分析方法,其特征在于,具体包括:S11基于政策文本的题目进行关键词的提取得到题目关键词,并基于所述题目关键词确定所述政策文本的类型;S12获取所述政策文本的段落数,并判断所述段落数是否小于预设段落,若是,则将所述政策文本的所有段落作为文本分析段落,并进入步骤S15;若否,则进入步骤S13;S13获取所述政策文本的字符数量,并基于所述政策文本的字符数量确定所述政策分析的提取时长是否满足要求,若是,则将所述政策文本的所有段落作为文本分析段落,并进入步骤S15;若否,则进入步骤S14;S14基于所述政策文本的段落数、字符数量、政策文本的类型,采用基于机器学习算法的评估模型,得到所述政策文本的重要度评估值,并判断所述重要度评估值是否大于预设评估值,若是,则将所述政策文本的所有段落作为文本分析段落,并进入步骤S15,若否,则基于所述政策文本的文本类型确定所述政策文本的核心关键词,并基于所述核心关键词确定所述政策文本的文本分析段落;S15基于所述文本分析段落进行关键词的提取得到文本关键词,并基于所述文本关键词的词频、文本关键词的类型、政策文本的文本类型,确定所述文本关键词的权值,并基于所述文本关键词、文本关键词的权值,得到所述政策文本的文本解析结果。

全文数据:

权利要求:

百度查询: 杭州正策信息科技有限公司 一种基于文本分析和识别的政策文本分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。