【发明公布】一种基于拼音约束的中文语法纠错方法_昆明理工大学_202410144119.X

导航：龙图腾网> 最新专利技术> 一种基于拼音约束的中文语法纠错方法_昆明理工大学_202410144119.X

申请/专利权人：昆明理工大学

申请日：2024-02-01

公开（公告）日：2024-05-03

公开（公告）号：CN117973372A

主分类号：G06F40/253

分类号：G06F40/253;G06F40/30;G06N3/0455

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.21#实质审查的生效;2024.05.03#公开

摘要：本发明涉及一种基于拼音约束的中文语法纠错方法，属自然语言处理技术领域。本发明首先基于原始BART模型构建端到端的语法纠错基础模型，该模型可以充分利用预训练语言模型自身的强表征能力，提升纠错性能；然后，在BART编码结束后增加一个检测层，通过有效错误检测缓解过度校正的问题；接着，利用字符的音似混淆集构建音似混淆矩阵，并将音似混淆矩阵与检测层输出做融合，得到输入句子中包涵错误的字符的音似信息；最后，利用音似信息对解码端的输出概率做约束，从而得到更加准确的纠错结果。

主权项：1.一种基于拼音约束的中文语法纠错方法，其特征在于：所述方法的具体步骤如下：Step1、基于预训练模型BART构造序列到序列的语法纠错基础模型；语法纠错基础模型分别采用多层多头注意力机制作为编码器和解码器有效捕捉上下文信息，同时还充分利用BART预训练语言模型的强表征能力增强纠错效果；Step2、在基于BART的语法纠错基础模型的编码端增加检测层，尝试通过检测模块过滤掉正确的句子不进行纠正，从而缓解过度纠正问题；Step3、利用字符的音似混淆集构建音似混淆矩阵，并将音似混淆矩阵与检测层输出做融合，得到输入句子中包涵错误的字符的音似信息；Step4、利用音似信息对解码端的输出概率做约束，从而得到更加准确的纠错结果。

全文数据：

权利要求：

百度查询：昆明理工大学一种基于拼音约束的中文语法纠错方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种制备纳米纤维膜的装置_温州医科大学_202410355682.1

下一篇：一类轴手性类PYE氮配体化合物及其制备方法和应用_广东工业大学_202410230056.X

相关技术

一种制备纳米纤维膜的装置_温州医科大学_202410355682.1

一类轴手性类PYE氮配体化合物及其制备方法和应用_广东工业大学_202410230056.X

一种早强型伸缩缝锚固区用混凝土材料及性能试验方法_广东省公路建设有限公司湾区特大桥养护技术中心_202410236084.2

微粒子测量装置及方法_友达光电股份有限公司_202410255697.0

一种新型包装箱开箱装置_辽宁典冠科技有限公司_202410263065.9

一种葡萄VvMYB306基因及其应用_新疆农业科学院园艺作物研究所_202410334183.4

一种环保水处理定量加药装置_苏州迪诺环保科技有限公司_202410375643.8

闸机结构_浙江优纳特科学仪器有限公司_202410384536.1

一种救生筏复合材料的生产设备及其生产工艺_烟台华洋救生装备制造有限公司_202410415235.0

一种纳米材料剥离水化膜的有效期预测方法、系统及设备_中国海洋石油集团有限公司_202410235153.8

二维桌面视图与三维桌面视图交互特效的显示方法及装置_重庆赛力斯凤凰智创科技有限公司_202410356596.2

一种改性乳化沥青粘层油合成系统_江苏北极星交通产业集团有限公司_202410251108.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于拼音约束的中文语法纠错方法_昆明理工大学_202410144119.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务