Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 语联网(武汉)信息技术有限公司张甫朝获国家专利权

语联网(武汉)信息技术有限公司张甫朝获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉语联网(武汉)信息技术有限公司申请的专利一种微任务语料数据清洗方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114564972B

龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210206766.X,技术领域涉及:G06F40/58;该发明授权一种微任务语料数据清洗方法是由张甫朝设计研发完成,并于2022-03-03向国家知识产权局提交的专利申请。

一种微任务语料数据清洗方法在说明书摘要公布了:本发明公开了一种微任务语料数据清洗方法,具体包括以下步骤:S1、对需要清洗的语料数据预先埋入已知结果的语料数据形成语料埋点数据后开始清洗;S2、配置语料数据的清洗参数;S3、清洗语料分类任务;S4、计算语料分类任务的分类结果:1获取分类结果可确认的语料;2计算一级译者处理语料分类任务的可信度;3确认语料分类任务的分类结果;4审核语料的分类结果S5、清洗语料编辑任务;S6、质检编辑后的语料。本发明包含语料分类任务和语料编辑任务的清洗,借助不同等级的译者清洗不同的任务,针对性强,提高清洗效率,同时借助系统算法对清洗任务进行自动审核和确认,能够减轻清洗工作量,节省清洗成本。

本发明授权一种微任务语料数据清洗方法在权利要求书中公布了:1.一种微任务语料数据清洗方法,其特征在于,具体包括如下步骤:S1、对需要清洗的语料数据预先埋入已知结果的语料数据形成语料埋点数据后开始清洗;S2、配置语料数据的清洗参数;S3、清洗语料分类任务:系统将语料分类任务分配至一级译者,一级译者分类处理一个或多个语料分类任务,其中每个语料分类任务包括一个或多个任务项,每个任务项对应一个条语料;S4、计算语料分类任务的分类结果:一级译者完成语料分类任务后计算自动执行分类结果,得出可直接使用的语料数据及需进行编辑的语料数据,具体包括如下步骤:1获取分类结果可确认的语料:当一条语料被多个一级译者进行处理分类,若所有一级译者的处理分类结果相同,则该条语料可确认;当语料分类任务为语料埋点数据,则语料分类任务处理的分类结果可确认;2计算一级译者处理语料分类任务的可信度:从一级译者参与的语料分类任务中获取所有已知结果的语料,记为A;计算出所有正确的分类结果,记为C;令RE=一级译者本次处理语料分类任务的可信度,则计算完成后,将本次处理语料分类任务的可信度计入一级译者的历史可信度;设RE1,RE2,RE3,...REn为一级译者的历史可信度,排除一级译者的最高历史可信度记录以及最低历史可信度,令REA=一级译者的最终可信度=平均可信度,则3确认语料分类任务的分类结果:一条语料由多名一级译者参与分类,从配置清洗参数中可获取是否需要修改的属性及修改属性值,令TV=修改属性值,TVP=每名一级译者获取的属性值,REA为步骤2计算出的一级译者平均可信度,则TVP=TV*REA,然后分别计算出是否需要修改的属性定义为“是”及“否”时每名一级译者获取的属性值;令a=是否需要修改的属性定义为“是”时的一级译者获取的属性值总和,b=是否需要修改的属性定义为“否”的一级译者获取的属性值总和,y=属性差,则计算得出y,将属性差y与配置清洗参数中的分类确认差阈值进行对比:若y分类确认差阈值,则语料的分类结果确认为需要修改;y≦分类确认差阈值则语料的分类结果确认为无需修改,其余的分类结果则为无法确认;4审核语料的分类结果:系统自动从语料无法确认的分类结果中抽取分类结果最难确认的一部分语料生成第一批审核任务,由二级译者担任审核员进行人工审核;二级译者完成第一批审核任务后,自动返回S4中的步骤3重新计算语料分类任务分类结果:若重新计算后仍得出语料无法确认的分类结果,则继续自动生成第二批审核任务,以此循环,直到所有语料任务分类结果确认为止;S5、清洗语料编辑任务:基于S4中得出的分类结果由二级译者或二级以上译者对语料数据进行修改和完善:1根据审核语料的分类结果对语料是否编辑进行判断:若语料确认需要修改的,则进行语料编辑流程;若语料确认为无需修改,则语料数据清洗完成;若语料无法确认的,则语料进行人工审核流程;2语料编辑任务完后,对编辑后的语料是否需要再次语料分类进行判断:若需要,则编辑后的语料重新进入S3步骤进行语料分类任务清洗;若不需要,则对编辑后的语料进行质检流程;S6、质检编辑后的语料:对编辑后不需要再次语料分类的语料由二级译者或二级以上译者进行人工质检:若人工质检通过,则语料数据完成清洗;若人工质检未通过,则返回S5重新进行语料编辑任务并填写编辑意见。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语联网(武汉)信息技术有限公司,其通讯地址为:430000 湖北省武汉市武汉东湖新技术开发区高新大道999号未来科技城B2栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。