买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置_湖北为华教育科技集团有限公司_202311457830.2 

申请/专利权人:湖北为华教育科技集团有限公司

申请日:2023-11-04

公开(公告)日:2024-04-02

公开(公告)号:CN117350302B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/284;G06F40/295;G06F18/241;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2024.01.23#实质审查的生效;2024.01.05#公开

摘要:本发明公开了一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置,通过读取维基百科的分类信息,对撰写文本进行关键词、同义词和相关词提取,构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构,实时提取撰写文本,基于构建的语言语义网络结构对已撰写文本语义进行提取,获得已撰写文本语义,提取已撰写文本语义和正在撰写的文本词语语义,导入词语语义合适度判断策略中计算文本词语的合适度,将文本词语的合适度与设定的合适阈值进行对比,在文本撰写的过程中依据构建的语言语义网络结构对撰写文本进行实时纠错,提高了文本纠错效率和文本纠错的准确性。

主权项:1.一种基于语义分析的语言撰写文本纠错方法,其特征在于,其包括以下具体步骤:S1、构建基于维基百科的语言知识库:读取维基百科的分类信息,对撰写文本进行关键词、同义词和相关词提取,构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构;S2、实时提取撰写文本,基于构建的语言语义网络结构对已撰写文本语义进行提取,获得已撰写文本语义;S3、提取已撰写文本语义和正在撰写的文本词语语义,导入词语语义合适度判断策略中计算文本词语的合适度;S4、将文本词语的合适度与设定的合适阈值进行对比,判断文本词语的合适度是否大于等于设定的合适阈值,若文本词语的合适度大于等于设定的合适阈值则就将该文本词语设为选择词语,若文本词语的合适度小于设定的合适阈值则提取该文本词语进行S5步骤;S5、获取文本词语的同义词和相关词,基于语义获取文本词语同义词和相关词的适配度,取适配度大于等于设定的适配阈值的文本词语同义词和相关词作为初选词,将初选词的适配度降序排列;S6、将适配度排列在前五的初选词和适配度数字显示在文本词语处供撰写人员选择并提示撰写人员;所述S1的内容包括以下具体步骤:S11、读取维基百科对该撰写文本的分类信息,获取文本的关键词,同时获取书写段落的文本词语;S12、提取文本词语的同义词和相关词,以构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构;所述S2具体包括以下步骤:S21、将获取的文本关键词添加从文本获取适当的的连接词连接为若干个文本语义句;S22、提取连接得到的若干个文本语义句,将这些文本语义句发送至撰写人员,撰写人员从这些文本语义句中找出最能代表文本语义的已撰写文本语义;S23、提取得到的已撰写文本语义,储存至设置的语义储存库中;所述S3中的词语语义合适度判断策略的具体步骤如下:S31、提取已撰写文本语义和正在撰写的文本词语语义,正在撰写的文本词语的若干个语义设为x1,x2,...,xi,...,xn1,其中,xi为正在撰写的文本词语的第i个语义,n1为正在撰写的文本词语的语义个数,同时提取正在撰写的文本词语的语义的词性表示,代入第一合适度计算公式中计算第一合适度,第一合适度计算公式为: 其中m1为括号内的语义符合已撰写文本语义的个数,m2为符合已撰写文本语义的语义的词性表示中符合正在撰写的文本的个数,yi为符合已撰写文本语义的第i项语义的词性表示,n2为符合已撰写文本语义的第i项语义的词性表示的个数,γ1为语义占比系数,γ2为词性表示占比系数,γ1+γ2=1;S32、同时提取该正在撰写的文本词语的撰写次数和正确次数,代入错误率计算公式中计算历史该正在撰写的文本词语的错误率,错误率计算公式为: 其中,a1为正确次数,a2为撰写次数;S33、将计算得到的第一合适度和错误率代入词语语义合适度计算公式中计算词语语义的合适度,词语语义合适度计算公式为: 所述S5包括以下具体步骤:S51、获取正在撰写的文本词语的同义词和相关词,查找正在撰写的文本词语的同义词和相关词中与已撰写文本词性适配的词,设为z1,z2,...,zi,...,zn3,其中,zi为正在撰写的文本词语中的第i个同义词和相关词与已撰写文本词性适配的词,n3为正在撰写的文本词语的同义词和相关词中与已撰写文本词性适配的词的个数;S52、获取与已撰写文本语义适配的若干个文本,获取z1,z2,...,zi,...,zn3中的词语在与已撰写文本语义适配的若干个文本中出现的概率,作为适配度,获取适配度大于等于设定的适配阈值的文本词语同义词和相关词作为初选词,将初选词的适配度降序排列。

全文数据:

权利要求:

百度查询: 湖北为华教育科技集团有限公司 一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。