【发明授权】基于主动学习的语料挖掘方法、装置及电子设备_腾讯科技(深圳)有限公司_202011141662.2

导航：龙图腾网> 最新专利技术> 基于主动学习的语料挖掘方法、装置及电子设备_腾讯科技(深圳)有限公司_202011141662.2

申请/专利权人：腾讯科技(深圳)有限公司

申请日：2020-10-22

公开（公告）日：2024-04-05

公开（公告）号：CN113407713B

主分类号：G06F16/35

分类号：G06F16/35;G06F16/36

优先权：

专利状态码：有效-授权

法律状态：2024.04.05#授权;2022.10.14#实质审查的生效;2021.09.17#公开

摘要：本申请实施例提供了基于主动学习的语料挖掘方法、装置及电子设备，涉及人工智能领域。该方法包括：获取未标注语料；利用至少两个预先训练好的语料分类模型对未标注语料进行分类，得到至少两个语料分类模型输出的、针对未标注语料进行分类的第一分类类型和分类分数；选取第一分类类型不一致、且分类分数符合预设条件的未标注语料作为待标注语料，对待标注语料进行二次分类处理，得到待标注语料的第二分类类型。本技术方案能够有利于扩宽语料挖掘的覆盖面，提高语料挖掘的泛化性。

主权项：1.一种基于主动学习的语料挖掘方法，其特征在于，包括：获取未标注语料；利用至少两个预先训练好的语料分类模型对所述未标注语料进行分类，得到至少两个所述语料分类模型输出的、针对所述未标注语料进行分类的第一分类类型和分类分数；所述第一分类类型包括正样本类型和负样本类型；所述分类分数用于表征相应未标注语料与冷启动语料的标注的设定技能的相关性；选取所述第一分类类型不一致、且所述分类分数符合预设条件的未标注语料作为待标注语料，包括：针对至少两个语料分类模型输出的第一分类类型不一致的未标注语料，基于各语料分类模型输出的分类分数得到总分数，若该总分数符合预设条件，则将该未标注语料确定为待标注语料；基于所述待标注语料的属性确定所述待标注语料是否对应于所述设定技能，以对所述待标注语料进行二次分类处理，得到所述待标注语料的第二分类类型，并基于所述第二分类类型标注所述待标注语料；所述第二分类类型包括正样本类型和负样本类型。

全文数据：

权利要求：

百度查询：腾讯科技(深圳)有限公司基于主动学习的语料挖掘方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：紫菜养殖筏架设施柱竹防治绿藻涂料的自动化涂装装备_苏州纽方兴纳米材料有限公司_201910529848.6

下一篇：一种圆柱型锂离子电池的壳体分解装置_力神动力电池系统有限公司_201810920064.1

相关技术

紫菜养殖筏架设施柱竹防治绿藻涂料的自动化涂装装备_苏州纽方兴纳米材料有限公司_201910529848.6

一种圆柱型锂离子电池的壳体分解装置_力神动力电池系统有限公司_201810920064.1

一种环保型防鼠防白蚁超高压智能电缆_广州岭南电缆股份有限公司_202410397327.0

一种广告标牌用切割机_陕西智嘉教育科技有限公司_202410336392.2

图片优化方法、装置、电子设备及存储介质_平安科技(深圳)有限公司_201911060155.3

电动车电机端盖压轴承和打胶综合机_台州市金宇机电有限公司_201711293857.7

一种用于监控的光学系统_中山联合光电科技股份有限公司_201910353870.X

一种多段式露营房_申允镐_202280061320.0

信息反馈方法、装置、计算机设备及计算机存储介质_江苏微皓智能科技有限公司_202410403691.3

一种快速脱伞系统及飞行器_四川凌空天行科技有限公司_202410405459.3

一种铁路用快速固定装置_株洲时代电子技术有限公司_201810892332.3

一种大葱自动化播种装置_山东沃华农业科技股份有限公司_202410393768.3

龙图腾网&IPTOP

【发明授权】基于主动学习的语料挖掘方法、装置及电子设备_腾讯科技(深圳)有限公司_202011141662.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务