【发明授权】一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置_湖北为华教育科技集团有限公司_202311457830.2

申请/专利权人：湖北为华教育科技集团有限公司

申请日：2023-11-04

公开（公告）日：2024-04-02

公开（公告）号：CN117350302B

主分类号：G06F40/30

分类号：G06F40/30;G06F40/284;G06F40/295;G06F18/241;G06F18/22

优先权：

专利状态码：有效-授权

法律状态：2024.04.02#授权;2024.01.23#实质审查的生效;2024.01.05#公开

摘要：本发明公开了一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置，通过读取维基百科的分类信息，对撰写文本进行关键词、同义词和相关词提取，构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构，实时提取撰写文本，基于构建的语言语义网络结构对已撰写文本语义进行提取，获得已撰写文本语义，提取已撰写文本语义和正在撰写的文本词语语义，导入词语语义合适度判断策略中计算文本词语的合适度，将文本词语的合适度与设定的合适阈值进行对比，在文本撰写的过程中依据构建的语言语义网络结构对撰写文本进行实时纠错，提高了文本纠错效率和文本纠错的准确性。

主权项：1.一种基于语义分析的语言撰写文本纠错方法，其特征在于，其包括以下具体步骤：S1、构建基于维基百科的语言知识库：读取维基百科的分类信息，对撰写文本进行关键词、同义词和相关词提取，构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构；S2、实时提取撰写文本，基于构建的语言语义网络结构对已撰写文本语义进行提取，获得已撰写文本语义；S3、提取已撰写文本语义和正在撰写的文本词语语义，导入词语语义合适度判断策略中计算文本词语的合适度；S4、将文本词语的合适度与设定的合适阈值进行对比，判断文本词语的合适度是否大于等于设定的合适阈值，若文本词语的合适度大于等于设定的合适阈值则就将该文本词语设为选择词语，若文本词语的合适度小于设定的合适阈值则提取该文本词语进行S5步骤；S5、获取文本词语的同义词和相关词，基于语义获取文本词语同义词和相关词的适配度，取适配度大于等于设定的适配阈值的文本词语同义词和相关词作为初选词，将初选词的适配度降序排列；S6、将适配度排列在前五的初选词和适配度数字显示在文本词语处供撰写人员选择并提示撰写人员；所述S1的内容包括以下具体步骤：S11、读取维基百科对该撰写文本的分类信息，获取文本的关键词，同时获取书写段落的文本词语；S12、提取文本词语的同义词和相关词，以构建包含类别、文章、关键词词表、同义词和相关词的语言语义网络结构；所述S2具体包括以下步骤：S21、将获取的文本关键词添加从文本获取适当的的连接词连接为若干个文本语义句；S22、提取连接得到的若干个文本语义句，将这些文本语义句发送至撰写人员，撰写人员从这些文本语义句中找出最能代表文本语义的已撰写文本语义；S23、提取得到的已撰写文本语义，储存至设置的语义储存库中；所述S3中的词语语义合适度判断策略的具体步骤如下：S31、提取已撰写文本语义和正在撰写的文本词语语义，正在撰写的文本词语的若干个语义设为x1,x2,...,xi,...,xn1，其中，xi为正在撰写的文本词语的第i个语义，n1为正在撰写的文本词语的语义个数，同时提取正在撰写的文本词语的语义的词性表示，代入第一合适度计算公式中计算第一合适度，第一合适度计算公式为：其中m1为括号内的语义符合已撰写文本语义的个数，m2为符合已撰写文本语义的语义的词性表示中符合正在撰写的文本的个数，yi为符合已撰写文本语义的第i项语义的词性表示，n2为符合已撰写文本语义的第i项语义的词性表示的个数，γ1为语义占比系数，γ2为词性表示占比系数，γ1+γ2＝1；S32、同时提取该正在撰写的文本词语的撰写次数和正确次数，代入错误率计算公式中计算历史该正在撰写的文本词语的错误率，错误率计算公式为：其中，a1为正确次数，a2为撰写次数；S33、将计算得到的第一合适度和错误率代入词语语义合适度计算公式中计算词语语义的合适度，词语语义合适度计算公式为：所述S5包括以下具体步骤：S51、获取正在撰写的文本词语的同义词和相关词，查找正在撰写的文本词语的同义词和相关词中与已撰写文本词性适配的词，设为z1,z2,...,zi,...,zn3，其中，zi为正在撰写的文本词语中的第i个同义词和相关词与已撰写文本词性适配的词，n3为正在撰写的文本词语的同义词和相关词中与已撰写文本词性适配的词的个数；S52、获取与已撰写文本语义适配的若干个文本，获取z1,z2,...,zi,...,zn3中的词语在与已撰写文本语义适配的若干个文本中出现的概率，作为适配度，获取适配度大于等于设定的适配阈值的文本词语同义词和相关词作为初选词，将初选词的适配度降序排列。

全文数据：

权利要求：

百度查询：湖北为华教育科技集团有限公司一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

下一篇：一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

相关技术

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种园林绿化便携铲_马丽丽_202322375183.2

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

纠错相关技术

一种普通话发音纠错器_临夏回族自治州职业技术学校_202322476719.X

西文文本的纠错方法和装置、电子设备及存储介质_北京百度网讯科技有限公司_202010605249.0

可信执行环境中基于纠错编码的共享区块链数据存储_创新先进技术有限公司_201980004503.7

按键误触纠错方法及装置_北京搜狗科技发展有限公司_201810717883.6

一种中文语法纠错方法及系统_长沙市智为信息技术有限公司_202410279802.4

输入纠错方法、系统、设备、存储介质及计算机程序产品_宁波方太厨具有限公司_202410142800.0

一种基于前后缀词库与困惑度的垂域文本纠错方法_天翼云科技有限公司_202311704382.1

一种基于大数据的纠错机制在线评估方法、系统及存储介质_易康(广州)数字科技有限公司_202311398464.8

基于多维量子纠错的消除噪声干扰的信息传输方法_青岛理工大学_202210228808.X

一种文本纠错数据的构造方法、装置和存储介质_广东南方网络信息科技有限公司_202211701492.8

文本相关技术

一种文本推荐方法、系统、存储介质和设备_济南大学_202111016193.6

一种基于深度学习的文本生成图像学习方法_大连理工大学_202111183091.3

文本检测方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202011020108.9

一种文本行图片的解码方法、装置和设备_北京有竹居网络技术有限公司_202110558943.6

基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质_大连海事大学_202011643169.0

文本意图识别方法、装置、设备和存储介质_平安科技(深圳)有限公司_202010033742.X

文本细粒度情感分类方法、系统、装置及存储介质_华南理工大学_202010560649.4

一种基于文本的实体识别方法及相关装置_广东工业大学_202010844442.X

一种相似文本内容的识别方法、装置及存储介质_广州腾讯科技有限公司_201810595368.5

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

方法相关技术

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202010617172.9

通信方法及装置_华为技术有限公司_202211296381.3

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

龙图腾网&IPTOP

【发明授权】一种基于语义分析的语言撰写文本纠错方法、系统及人机交互装置_湖北为华教育科技集团有限公司_202311457830.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务