申请/专利权人:浙江工业大学
申请日:2021-05-28
公开(公告)日:2021-09-17
公开(公告)号:CN113408286A
主分类号:G06F40/295(20200101)
分类号:G06F40/295(20200101);G06F40/216(20200101)
优先权:
专利状态码:在审-实质审查的生效
法律状态:2021.10.08#实质审查的生效;2021.09.17#公开
摘要:一种面向机械化工领域的中文实体识别方法,包括:采取短文本预处理来提取有效内容;采用经过词典优化的中文分词器进行中文分词和词性标注;利用词频与类优先级函数所构成的权重函数用作权重计算同时基于规则式优化加权提取短文本目标关键词;搜索目标关键词上下文基于构建的有向概率状态转化图来进行关键词的上下文扩展从而获得目标实体。本发明还包括实施一种面向机械化工领域的中文实体识别方法的系统,包括依次连接的短文本预处理模块、中文分词和词性标注模块、权重计算和规则式优化加权模块、关键词搜索和扩展模块。本发明实现了高准确率的中文实体识别。
主权项:1.一种面向机械化工领域的中文实体识别方法,包含如下步骤:1采取短文本预处理来提取有效内容;2采用经过词典优化的中文分词器进行中文分词和词性标注筛选出名词;3利用词频与类优先级函数所构成的权重函数用作权重计算同时基于规则式优化加权提取短文本最高权重关键词;4搜索权重最高关键词的上下文同时基于构建的有向概率状态转化图来进行关键词的上下文扩展从而形成目标实体。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种面向机械化工领域的中文实体识别方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。